少尉
- 注册时间
- 2016-10-18
- 金币
- 151 个
- 威望
- 2 个
- 荣誉
- 0 个
累计签到:36 天 连续签到:0 天 [LV.50]初入江湖
|
引用随风大侠“
1.去掉8位数字
2.排序去重
3.去掉中文字符(只留国际标准数字字母符号)。
4.去掉有13.15.18开头的手机号码
5.去掉8-64外的字符
”
大前提是linux平台,win下的cygwin也行,我就正在用
还用过win10自带的linux子系统,在控制面板——卸载程序——启用或关闭windows功能里
我就只用过这两种,都很棒,其他类似应该还有很多吧
用linux的bash指令处理txt字典文件,无论几十G
还是上百G,都very very简单迅速,最起码鼠标和画面不会冻住
1)下别人的字典我不介意里面有没有8位纯数字,只管cat 全部 >new.txt
2)那就sort -u
3)中文字符包括GB2312 GBK繁体等等,"s/[\x81-\xFE][\x40-\xFE]//g"这个正则就挺好的
所有中文字符全都踢了
4)不是自己本地的手机号确实麻烦,我暂时用的这个正则代码:‘^1[3|4|5|7|8][0-9]\\d{9}$‘
5)64位?好夸张啊。。wpa的极限长度,其实一般17位我个人意见觉得就可以了
比如11位手机号+两人姓名缩写,即便两人都是三个字,刚好17位
|
|