随风飘 发表于 2013-5-2 15:49

*五一节巨献--淘宝的裤子*+UE字典制作处理教程

本帖最后由 随风飘 于 2013-5-8 23:28 编辑

要字典工具的点这里;
城通网盘,广告较多,不喜欢勿进。
里面没有字典,只有工具。
以后也不会上传字典。
http://proesj.400gb.com/




随风飘 发表于 2013-5-2 15:50

本帖最后由 随风飘 于 2013-5-8 23:18 编辑

教程开始:
全UE工具处理
就本字典而言,是灰常简单的。
下面是我做字典的习惯:
1.为了保险起见,先干掉行尾与行首的空格正则:
正则表达式引擎选择unix下的:删除行首空格^\s+    再删除行尾空格:\s+$
2.去掉@后面的字符(邮箱后缀):
正则表达式引擎选择unix下的:@.*$(这个只限这个数据库处理)
或者perl下面的:@[\w-]+(\.[\w-]+)+$(这个比较通用型的)
3.去掉中文
点到文件--转换 UNICODE/UTF-8转UTF-8(Unicode编辑)选项成黑色(如果色盲看到的可能是灰色;P)
正则处理:[^一-龥]删除中文
完成后最好回到之前这一项是灰色的,因为这种格式的文件打开后占地方很大。
4.然后去掉8位数字
正则表达式引擎选择Unix
^(\d\d\d\d\d\d\d\d)$
5.再去掉有首级的:lol
正则表达式引擎选择Unix
里面的13...15。。。。是啥意思?,我一般人不告诉他。
^.*(13\d\d\d\d\d\d\d\d\d|15\d\d\d\d\d\d\d\d\d).*$
6.排序去重复
文件--排序--用下面那个高级点的。
选择用交互排序,不用虚拟内存的。
7.处理后面的事
前面有一行空的,去掉就OK。
再去掉与其它字典有重复的。
8.还不明白看下图
9.还不明白交钱
10.还不明白偶也没办法,你自己看着办吧。





way1012 发表于 2013-5-2 15:56

用户名。。。。。。。。。。
厄。。。。。

port 发表于 2013-5-2 15:58

最想要原稿的:lol想制作自己想要的

zhangbaida 发表于 2013-5-2 16:00

我来占个位置哈

port 发表于 2013-5-2 16:04

这个难道是几个G大???:o:o:o

guokezh 发表于 2013-5-2 16:06


我来占个位置哈

qq356895239 发表于 2013-5-2 16:08

占位留名....................

qiqilele521 发表于 2013-5-2 16:10

    不知道是什么东西,留名观察。。

xinyonghu 发表于 2013-5-2 16:11

本帖最后由 xinyonghu 于 2013-5-2 16:19 编辑

是这个吗?

cnzspx 发表于 2013-5-2 16:11

关注一下 :lol

fslijun 发表于 2013-5-2 16:13

马上占位看看
页: [1] 2 3 4 5 6 7 8 9 10
查看完整版本: *五一节巨献--淘宝的裤子*+UE字典制作处理教程