mmfdr 发表于 2017-1-27 06:37

随风飘 发表于 2017-1-26 12:03
那些年2000W的那个数据选取出的姓名两个字与三个字的姓名去重后几百W
中文文件不是拼音

专家如何提取两个字的中文名字呢

mmfdr 发表于 2017-1-27 06:49

yunnanyaic 发表于 2017-1-26 21:44
现整理出最终解决方法:
1、将字典导入Oracle中;
2、使用《Oracle汉字转拼音Package(获得全拼、拼音 ...

汉字转拼音其实很简单,没有这么复杂

panxat163com 发表于 2017-1-27 08:44

mmfdr 发表于 2017-1-27 06:49
汉字转拼音其实很简单,没有这么复杂
将军说的对!准备春节期出个新华拼音词典,届时像组合老子、孔子、巴顿、普京、特朗普、成吉思汗、狗儿、波斯猫、我是.......的拼音名字都不是问题。

yunnanyaic 发表于 2017-1-27 09:35

mmfdr 发表于 2017-1-27 06:37
专家如何提取两个字的中文名字呢

我是在导入数据库时按照两个字节对应一个汉字的方式截取两个、三个或者四个汉字当作两姓名、三姓名和复姓名的。如果已经转换为拼音再去截取感觉太麻烦,要去计算声母、韵母的所有组合再做判断截取。

yunnanyaic 发表于 2017-1-27 09:37

mmfdr 发表于 2017-1-27 06:49
汉字转拼音其实很简单,没有这么复杂

请大神传授下更简单的汉字转拼音姿势吧,以前一直很少转——密到用时方恨少:lol

mmfdr 发表于 2017-1-27 09:46

yunnanyaic 发表于 2017-1-27 09:37
请大神传授下更简单的汉字转拼音姿势吧,以前一直很少转——密到用时方恨少

发给你过去了

kk6065 发表于 2017-1-27 16:12

感谢分享如此好的东西谢谢

mmfdr 发表于 2017-1-27 22:15

本帖最后由 mmfdr 于 2017-1-27 22:49 编辑

随风飘 发表于 2017-1-26 12:03
那些年2000W的那个数据选取出的姓名两个字与三个字的姓名去重后几百W
中文文件不是拼音
收到了谢谢飘大神:victory:

游鱼自燃 发表于 2017-1-28 06:04

我也想要原汁原味的裤子!

ejoin 发表于 2017-2-1 14:17

支持楼主的分享

qwe_2016 发表于 2017-2-6 11:35

好热,闹的说      

爱你无浪 发表于 2017-2-7 00:04

虽然不会弄还是要顶一下!
页: 1 2 3 [4] 5
查看完整版本: 鸡年新春大福利!精选自760万各分类裤子的33万个小伙伴真实姓名