天道酬勤,学无止境

chinese-locale

如何在 Android 上使用 Google 的文字转语音服务进行汉字转换?(How to use Google's Text-to-Speech service for Chinese characters on Android?)

问题 我正在尝试从 google 的文本转语音功能中提取音频文件。 基本上,您将链接放入,然后在链接的末尾连接您想说的任何内容。 我已经让下面的代码对英语工作得很好,所以我认为问题一定是中文字符是如何在请求中编码的。 这是我所拥有的: String text = "text to be spoken"; public static final String AUDIO_CHINESE= "http://www.translate.google.com/translate_tts?tl=zh&q="; public static final String AUDIO_ENGLISH = "http://www.translate.google.com/translate_tts?tl=en&q="; URL url = new URL(AUDIO_ENGLISH + text); urlConnection = (HttpURLConnection) url.openConnection(); urlConnection.setRequestMethod("GET"); urlConnection.setRequestProperty("Accept-Charset", Variables.UTF_8); if (urlConnection.getResponseCode() =

2021-09-18 08:44:05    分类:技术分享    java   android   url   url-encoding   chinese-locale

How to detect Chinese Character in MySQL?

I need to calculate the number of Chinese in a list of columns. For Example, if "北京实业" occur, this is four characters in Chinese but I only count once since it occurs in the column. Is there any specific code to figure this out?

2021-09-04 20:14:24    分类:问答    mysql   utf-8   mysql-workbench   chinese-locale

How to read Chinese files?

I'm stuck with all this confusing encoding stuff. I have a file containing Chinese subs. I actually believe it is UTF-8 because using this in Notepad++ gives me a very good result. If I set gb2312 the Chinese part is still fine, but I will see some UTF8 code not being converted. The goal is to loop through the text in the file and count how many times the different chars come up. import os import re import io character_dict = {} for dirname, dirnames, filenames in os.walk('.'): for filename in filenames: if "srt" in filename: import codecs f = codecs.open(filename, 'r', 'gb2312', errors=

2021-07-03 04:10:40    分类:问答    python   unicode   utf-8   chinese-locale

Showing navigator.geolocation.getCurrentPosition in Baidu Maps

We know that due to the infamous China GPS offset problem, GPS (WSG-84) map coordinates don't correspond exactly to the coordinate system that state-approved Chinese maps use (GCJ-02). The question is, how does one make sure that placing a marker via the Baidu Maps API at the coordinates reported by navigator.geolocation.getCurrentPosition() will match reality? Would the GPS chip of a device manufactured or approved for use in China return coordinates that don't match the actual position of a user, in order to instead match he GJC-02 maps? Does it matter if the user runs a Chinese navigator (e

2021-06-26 15:44:37    分类:问答    javascript   google-maps   geolocation   chinese-locale   baidu

如何在熊猫数据框中显示汉字?(How to display Chinese characters inside a pandas dataframe?)

问题 我可以读取一个csv文件,其中有一列包含汉字(其他列是英文和数字)。 但是,中文字符无法正确显示。 看下面的照片 我用pd.read_csv()加载了 csv 文件。 display(data06_16)或data06_16.head()都不能正确显示汉字。 我尝试将以下几行添加到我的.bash_profile : export LC_ALL=zh_CN.UTF-8 export LANG=zh_CN.UTF-8 export LC_ALL=en_US.UTF-8 export LANG=en_US.UTF-8 但它没有帮助。 我也尝试将encoding arg 添加到pd.read_csv() : pd.read_csv('data.csv', encoding='utf_8') pd.read_csv('data.csv', encoding='utf_16') pd.read_csv('data.csv', encoding='utf_32') 这些根本行不通。 如何正确显示汉字? 回答1 我只记得源数据集是使用encoding='GBK'创建encoding='GBK' ,所以我再次尝试使用 data06_16 = pd.read_csv("../data/stocks1542monthly.csv", encoding="GBK") 现在,我可以看到所有的汉字。

2021-06-25 04:42:12    分类:技术分享    python   csv   pandas   encoding   chinese-locale

ReportLab:使用中文/Unicode 字符(ReportLab: working with Chinese/Unicode characters)

问题 TL;DR:有没有办法告诉 ReportLab 使用特定字体,如果某些字符的字形丢失,则回退到另一种字体? 或者,您是否知道包含所有欧洲语言、希伯来语、俄语、中文、日语和阿拉伯语的字形的精简 TrueType 字体? 我一直在用 ReportLab 创建报告,在渲染包含中文字符的字符串时遇到了问题。 我一直在使用的字体是 DejaVu Sans Condensed,它不包含中文字形(但是,它确实包含西里尔文、希伯来文、阿拉伯文和各种用于欧洲语言支持的变音符号 - 这使它非常通用,我需要他们不时地) 但是,该字体不支持中文,而且我找不到支持所有语言并满足我们图形设计要求的 TrueType 字体。 作为临时解决方法,我让中国客户的报告使用完全不同的字体,仅包含英文和中文字形,希望其他语言的字符不会出现在字符串中。 然而,由于显而易见的原因,这很笨重并且破坏了图形设计,因为它不是 DejaVu Sans,整个外观和感觉都是围绕它设计的。 所以问题是,您将如何处理在一个文档中支持多种语言的需求,并为每种语言维护指定字体的使用。 由于有时字符串包含多种语言,因此这变得更加复杂,因此无法确定每个字符串应使用哪种字体。 有没有办法告诉 ReportLab 使用特定字体,如果某些字符的字形丢失,则回退到另一种字体? 我在文档中发现了模糊的提示,这应该是可能的,尽管我可能理解错误。 或者

2021-06-23 14:24:27    分类:技术分享    python   unicode   fonts   reportlab   chinese-locale

如何在 Swift 中检查字符串是否包含中文?(How can I check if a string contains Chinese in Swift?)

问题 我想知道如何在Swift中检查字符串是否包含中文? 比如我想检查里面有没有中文: var myString = "Hi! 大家好!It's contains Chinese!" 谢谢! 回答1 这个如何确定一个字符是否为中文字符的答案也可以很容易地从 Ruby 翻译成 Swift(现在已针对 Swift 3 进行了更新): extension String { var containsChineseCharacters: Bool { return self.range(of: "\\p{Han}", options: .regularExpression) != nil } } if myString.containsChineseCharacters { print("Contains Chinese") } 在正则表达式中,"\p{Han}" 匹配所有具有 "Han" Unicode 属性的字符,据我所知,它们是来自 CJK 语言的字符。 回答2 查看有关如何在其他语言中执行此操作的问题(例如此已接受的 Ruby 答案),似乎常用的技术是确定字符串中的每个字符是否属于 CJK 范围。 ruby 答案可以适用于 Swift 字符串作为扩展名,代码如下: extension String { var containsChineseCharacters: Bool {

2021-06-22 05:54:53    分类:技术分享    swift   chinese-locale

How to use Google's Text-to-Speech service for Chinese characters on Android?

I'm trying to pull an audio file from google's text-to-speech function. Basically, you toss in the link and then concat whatever you want to be spoken at the end of it. I've gotten the below code to work just fine for English, so I think the problem must be how the Chinese characters are getting encoded in the request. Here's what I've got: String text = "text to be spoken"; public static final String AUDIO_CHINESE= "http://www.translate.google.com/translate_tts?tl=zh&q="; public static final String AUDIO_ENGLISH = "http://www.translate.google.com/translate_tts?tl=en&q="; URL url = new URL

2021-06-14 13:51:14    分类:问答    java   android   url   url-encoding   chinese-locale

为中文字符创建 URL slug。 使用 PHP(create URL slugs for chinese characters. Using PHP)

问题 我的用户有时使用汉字作为他们输入的标题。 我的 slug 的格式为/stories/:id-:name ,其中一个例子可能是/stories/1-i-love-php 。 我如何允许中文字符? 我在谷歌上搜索并在这里找到了这个答案的日文版。 不是很懂日文,所以我问的是中文版。 谢谢你。 回答1 我已经用孟加拉语字符测试过 它可能工作。 试试这个:首先编码的页面(在页面中写入代码)必须转换为UTF-8的编码类型,然后编写代码。 代码在这里: function to_slug($string, $separator = '-') { $re = "/(\\s|\\".$separator.")+/mu"; $str = @trim($string); $subst = $separator; $result = preg_replace($re, $subst, $str); return $result; } $id=34; $string_text="আড়াইহাজারে দেড় বছরের --- শিশুর -গলায় ছুরি"; $base_url="http://example.com/"; echo $target_url=$base_url.$id."-". @to_slug($string_text); var_dump($target_url); 输出:

2021-06-11 20:56:16    分类:技术分享    php   regex   slug   non-ascii-characters   chinese-locale

IText - 用汉字生成PDF(简体中文)(IText - Generating PDF with Chinese characters (Chinese Simplified))

问题 我正在使用 iText 生成一些 PDF,这些 pdf 有一些中文字符(简体中文 - GB2312),但是我无法生成带有这些字符的 pdf。 谁能告诉我我错在哪里? 我尝试使用各种形式的创作但没有成功: BaseFont bf = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED); com.itextpdf.text.DocumentException: Font 'STSong-Light' with 'UniGB-UCS2-H' is not recognized. at com.itextpdf.text.pdf.BaseFont.createFont(BaseFont.java:699) at com.itextpdf.text.pdf.BaseFont.createFont(BaseFont.java:606) at com.itextpdf.text.pdf.BaseFont.createFont(BaseFont.java:441) at com.ford.fc.frc.render.wsltopdf.PDFDefaultWriter.printText(PDFDefaultWriter.java:176) at com.ford.fc.frc.render

2021-06-11 12:23:18    分类:技术分享    java   pdf   itext   chinese-locale