天道酬勤,学无止境

chinese-locale

简体中文和繁体中文的语言代码?(Language codes for simplified Chinese and traditional Chinese?)

问题 我们正在我们的网站上创建多语言子网站。 我想使用 2 个字母的语言代码。 西班牙语和法语很容易。 他们将获得如下网址: mydomain.com/es mydomain.com/fr 但我遇到了繁体和简体中文的问题。 这些语言是否有使用 2 个字母代码的标准? mydomain.com/zh mydomain.com/? 回答1 @dkarp 给出了一个很好的一般答案。 我将添加一些关于中文的额外细节: 有几个国家以中文为主要书面语言。 它们之间的主要区别是使用简体字还是繁体字,但也有细微的地区差异(词汇等)。 区分这些的标准方法是使用国家代码,例如zh_CN代表中国大陆, zh_SG代表新加坡, zh_TW代表台湾,或zh_HK代表香港。 中国大陆和新加坡都使用简体字,其他都使用繁体字。 由于中国和台湾是人口最多的两个地区,因此通常仅使用zh_CN和zh_TW来区分网站的简体和繁体版本。 然而,技术上更正确但在实践中不常用的方法是将zh_HANS用于(通用)简体中文字符,而zh_HANT用于繁体中文字符,除非在区分不同国家有意义的罕见情况下。 回答2 这确实有一个标准表示。 由于人们遇到了您所看到的完全相同的问题——相同的语言,但不同的方言或字符——他们用两个字母的区域代码扩展了两个字母的语言代码。 因此,您可能在mydomain.com/fr有一个通用的法语页面

2021-10-21 17:57:51    分类:技术分享    utf-8   internationalization   cjk   chinese-locale

如何在c#中使用ITextSharp在PDF中显示中文字符?(How to display chinese characters in PDF using ITextSharp in c#?)

问题 我想在 PDF 中显示一个汉字和英文字符。 目前中文字符没有在 PDF 中显示。我使用 itextsharp 生成包含内容的 pdf。我尝试了一些中文字体但没有工作。 如何使用 itextsharp 在 PDF 中显示中文字符和英文字符? var docIndex = new Document(new Rectangle(792, 612)); var writer = PdfWriter.GetInstance(docIndex, new FileStream(Server.MapPath("~") + "/pdf/Project-" + report.pulledId + currentTime + ".pdf", FileMode.Create)); docIndex.Open(); FontFactory.Register("c:/windows/fonts/msmincho.ttc"); StyleSheet style = new StyleSheet(); style.LoadTagStyle("body", "face", "songti"); style.LoadTagStyle("body", "encoding", BaseFont.IDENTITY_H); foreach (var elementIndex in HTMLWorker

2021-10-19 22:58:24    分类:技术分享    c#   pdf   itext   chinese-locale

如何使用 mPDF for Chinese Language(How to use mPDF for Chinese Language)

问题 我正在使用 mPDF 将表单输入数据保存为 PDF。 对于英语,它工作正常。 任何人都可以使用此代码将 HTML 表单数据保存为 PDF。 问题:为了满足我的项目要求,我需要使用中文。 我当前的代码对此不起作用。 表单.html <form action='processPDF.php' method='post'> <label for="name">Name</label> <input name="name" type="text" id="name"> <input type='submit' name='submit' value='Download PDF'> </form> 进程PDF.php <?php header('Content-Type: text/html; charset=UTF-8'); if (isset($_POST['submit'])) { if (isset($_POST['name'])) { $name = $_POST['name']; } else { $Larmtid = ''; } if (!isset($error)) { ob_start(); ?> <div style="padding:20px;"> <p>Name: <?php echo $name; ?></p> </div> <?php $body = ob

2021-10-19 21:47:17    分类:技术分享    php   html   pdf   mpdf   chinese-locale

.NET Chinese CultureInfo "zh" 不存在?(.NET Chinese CultureInfo "zh" does not exist?)

问题 我正在使用 .NET 3.5 并运行以下代码: var culture = new CultureInfo("zh"); // Throws ArgumentException 我从 xml:lang 属性中得到字符串“zh”。 我不明白为什么会抛出异常,因为例如“de”(这是“de-DE”的父级)工作正常。 文化“zh-CN”确实有效,但这不是我可以使用的。 编辑:它适用于 .NET 4.5.1(感谢 xanatos) - 所以即使 MSDN 页面解释说中文是一个例外,在较新的 .NET 版本中行为也有所不同。 回答1 CultureInfo 页面上有一个小注释: 有两个文化名称与此规则相矛盾。 文化中文(简体),命名为 zh-Hans,中文(繁体),命名为 zh-Hant,是中性文化。 区域性名称代表当前标准,除非您有理由使用旧名称 zh-CHS 和 zh-CHT,否则应使用该名称。 所以你可以试试zh-Hans或zh-Hant 和/或您可以看到 .NET 3.5 中的 CultureInfo 类支持哪些文化? 接受的答案说: 不幸的是,它依赖于操作系统。 在此处查看每个操作系统的默认语言支持。 回答2 在 .NET 3.5 中“zh”不起作用,请改用“zh-Hans”或“zh-Hant”。 没有找到更好的解决方案。 或者切换到 .NET 4.5。

2021-10-14 16:49:41    分类:技术分享    c#   cultureinfo   chinese-locale

.NET Chinese CultureInfo "zh" does not exist?

I'm using .NET 3.5 and running the following code: var culture = new CultureInfo("zh"); // Throws ArgumentException I got the string "zh" from an xml:lang attribute. I don't understand why an exception is thrown, because for instance "de" (wich is parent for "de-DE") is working fine. The culture "zh-CN" does work, but thats nothing that I can use. Edit: It works on .NET 4.5.1 (thanks to xanatos) - so even if the MSDN page explains that Chinese is an exception, the behaviour is different in newer .NET versions.

2021-10-11 14:49:40    分类:问答    c#   cultureinfo   chinese-locale

如何读取中文文件?(How to read Chinese files?)

问题 我被所有这些令人困惑的编码内容所困扰。 我有一个包含中文字幕的文件。 我实际上相信它是 UTF-8,因为在 Notepad++ 中使用它会给我一个很好的结果。 如果我设置 gb2312 中文部分还是可以的,但是我会看到一些 UTF8 代码没有被转换。 目标是遍历文件中的文本并计算不同字符出现的次数。 import os import re import io character_dict = {} for dirname, dirnames, filenames in os.walk('.'): for filename in filenames: if "srt" in filename: import codecs f = codecs.open(filename, 'r', 'gb2312', errors='ignore') s = f.read() # deleting {} s = re.sub('{[^}]+}', '', s) # deleting every line that does not start with a chinese char s = re.sub(r'(?m)^[A-Z0-9a-z].*\n?', '', s) # delete non chinese chars s = re.sub(r'[\s\.A-Za-z0-9\?\!\\/\-

2021-09-30 21:06:13    分类:技术分享    python   unicode   utf-8   chinese-locale

How to display chinese characters in PDF using ITextSharp in c#?

I want to display one word of chinese characters in PDF along with english characters. Currently chinese characters are not getting displayed in PDF.I have used itextsharp to generate pdf with contents.I have tried some chinese fonts but not working. How to show chinese characters along with english characters in PDF using itextsharp? var docIndex = new Document(new Rectangle(792, 612)); var writer = PdfWriter.GetInstance(docIndex, new FileStream(Server.MapPath("~") + "/pdf/Project-" + report.pulledId + currentTime + ".pdf", FileMode.Create)); docIndex.Open(); FontFactory.Register("c:/windows

2021-09-29 08:39:16    分类:问答    c#   pdf   itext   chinese-locale

在java中解析汉字显示奇怪的行为(parsing chinese characters in java showing weird behaviour)

问题 我有一个 csv 文件,其中有一些包含中文字符串的字段。 不幸的是,我不知道这个输入 csv 文件的编码是什么。 我正在尝试读取此输入 csv 并使用其中的选择性字段,我正在制作一个 html 和另一个 csv 文件作为输出。 在读取 csv 输入时,我尝试了列表 http://docs.oracle.com/javase/7/docs/technotes/guides/intl/encoding.doc.html 中的所有编码,其中在描述中提到了中文。 并发现如果我使用 InputStreamReader read = new InputStreamReader(filepath,"GB18030"); 用于读取 csv 和 OutputStreamWriter osW=new OutputStreamWriter(objBufferedOutputStream,"UTF-16"); 对于编写 html 和 csv,我的输出没有显示奇怪的字符。 但是,有两个问题: 输出显示的字符串与输入完全不同! 我的意思是,即使我没有对我的代码中的任何字符串进行任何处理,在输入 csv 的任何字段中都找不到输出。 例如,我的输入有一个中文字符字符串:陈真珍在字段编号 8 上。但我的输出 html 有类似:闄堢湡鐝 ,它对应于输入字段编号 8。 正如你所看到的,有一个问号,即在输出闄堢湡鐝

2021-09-29 01:11:17    分类:技术分享    java   string   character-encoding   chinese-locale

parsing chinese characters in java showing weird behaviour

I am having a csv file which has some fields having chinese character strings. Unfortunately i dont know what is encoding of this input csv file. I am trying to read this input csv and using selective fields from it, i am making a html and another csv file as output. While reading csv input, i tried all encoding from list http://docs.oracle.com/javase/7/docs/technotes/guides/intl/encoding.doc.html which have Chinese mentioned in their description. And found if I use InputStreamReader read = new InputStreamReader(filepath,"GB18030"); for reading csv and OutputStreamWriter osW=new

2021-09-29 00:33:22    分类:问答    java   string   character-encoding   chinese-locale

在百度地图中显示navigator.geolocation.getCurrentPosition(Showing navigator.geolocation.getCurrentPosition in Baidu Maps)

问题 我们知道,由于臭名昭著的中国 GPS 偏移问题,GPS (WSG-84) 地图坐标与国家批准的中国地图使用的坐标系 (GCJ-02) 不完全对应。 问题是,如何确保通过百度地图 API 在navigator.geolocation.getCurrentPosition()报告的坐标处放置标记与现实相符? 在中国制造或批准使用的设备的 GPS 芯片是否会返回与用户实际位置不匹配的坐标,以匹配他的 GJC-02 地图? 用户运行中文导航器(例如 Maxthon 或中文本地化的 Google Chrome)与非中文浏览器(例如英文版的 Firefox)是否重要? 这是一个测试地理定位并使用百度地图坐标转换 API 的 JSBin。 不幸的是,我不在中国,所以我无法测试。 这是问题: 上面的应用程序是否需要在从navigator.geolocation.getCurrentPosition()获取的坐标上运行百度坐标转换才能在百度地图上正确显示位置? 位于中国的人是否可以在中国制造的设备上同时使用中文浏览器,并在非中国设备上使用非中文浏览器进行测试? 回答1 嗯...首先,似乎他们有一个 API 可以做到这一点:原始 gps 位置到 baidu gps 位置。 我找不到文档,但我认为他们的jsfiddle(?)可能会给你一个开始的想法。 至于设备和浏览器

2021-09-19 20:39:51    分类:技术分享    javascript   google-maps   geolocation   chinese-locale   baidu