mmfdr
发表于 2017-1-27 06:37
随风飘 发表于 2017-1-26 12:03
那些年2000W的那个数据选取出的姓名两个字与三个字的姓名去重后几百W
中文文件不是拼音
专家如何提取两个字的中文名字呢
mmfdr
发表于 2017-1-27 06:49
yunnanyaic 发表于 2017-1-26 21:44
现整理出最终解决方法:
1、将字典导入Oracle中;
2、使用《Oracle汉字转拼音Package(获得全拼、拼音 ...
汉字转拼音其实很简单,没有这么复杂
panxat163com
发表于 2017-1-27 08:44
mmfdr 发表于 2017-1-27 06:49
汉字转拼音其实很简单,没有这么复杂
将军说的对!准备春节期出个新华拼音词典,届时像组合老子、孔子、巴顿、普京、特朗普、成吉思汗、狗儿、波斯猫、我是.......的拼音名字都不是问题。
yunnanyaic
发表于 2017-1-27 09:35
mmfdr 发表于 2017-1-27 06:37
专家如何提取两个字的中文名字呢
我是在导入数据库时按照两个字节对应一个汉字的方式截取两个、三个或者四个汉字当作两姓名、三姓名和复姓名的。如果已经转换为拼音再去截取感觉太麻烦,要去计算声母、韵母的所有组合再做判断截取。
yunnanyaic
发表于 2017-1-27 09:37
mmfdr 发表于 2017-1-27 06:49
汉字转拼音其实很简单,没有这么复杂
请大神传授下更简单的汉字转拼音姿势吧,以前一直很少转——密到用时方恨少:lol
mmfdr
发表于 2017-1-27 09:46
yunnanyaic 发表于 2017-1-27 09:37
请大神传授下更简单的汉字转拼音姿势吧,以前一直很少转——密到用时方恨少
发给你过去了
kk6065
发表于 2017-1-27 16:12
感谢分享如此好的东西谢谢
mmfdr
发表于 2017-1-27 22:15
本帖最后由 mmfdr 于 2017-1-27 22:49 编辑
随风飘 发表于 2017-1-26 12:03
那些年2000W的那个数据选取出的姓名两个字与三个字的姓名去重后几百W
中文文件不是拼音
收到了谢谢飘大神:victory:
游鱼自燃
发表于 2017-1-28 06:04
我也想要原汁原味的裤子!
ejoin
发表于 2017-2-1 14:17
支持楼主的分享
qwe_2016
发表于 2017-2-6 11:35
好热,闹的说
爱你无浪
发表于 2017-2-7 00:04
虽然不会弄还是要顶一下!