DKblue 发表于 2017-11-5 20:41

刚看随风大侠有感说两句字典处理

引用随风大侠“
1.去掉8位数字
2.排序去重
3.去掉中文字符(只留国际标准数字字母符号)。
4.去掉有13.15.18开头的手机号码
5.去掉8-64外的字符

大前提是linux平台,win下的cygwin也行,我就正在用
还用过win10自带的linux子系统,在控制面板——卸载程序——启用或关闭windows功能里
我就只用过这两种,都很棒,其他类似应该还有很多吧
用linux的bash指令处理txt字典文件,无论几十G
还是上百G,都very very简单迅速,最起码鼠标和画面不会冻住
1)下别人的字典我不介意里面有没有8位纯数字,只管cat 全部 >new.txt
2)那就sort -u
3)中文字符包括GB2312 GBK繁体等等,"s/[\x81-\xFE][\x40-\xFE]//g"这个正则就挺好的
所有中文字符全都踢了
4)不是自己本地的手机号确实麻烦,我暂时用的这个正则代码:‘^1\\d{9}$‘
5)64位?好夸张啊。。wpa的极限长度,其实一般17位我个人意见觉得就可以了
比如11位手机号+两人姓名缩写,即便两人都是三个字,刚好17位

devlam 发表于 2018-1-30 13:48

@上上网 @随风飘再次请教俩大侠,如何在一个文本文件中的每一行的指定列插入一串字符
比如在例6前面插入a
123456789 --> 12345a6789
987654321 --> 98765a4321
看了几篇文章还是不会。。
http://blog.sina.com.cn/s/blog_6561ca8c0102we0o.html
awk '{$NF="RR"$NF; print}' <wbr> filename


http://blog.51cto.com/6226001001/1612127
awk '$O=$O" X"' urfile

DKblue 发表于 2017-11-5 20:43

补充:
8——17位的正则应该这个吧
"^.{8,17}$"

随风飘 发表于 2017-11-5 20:48

01234567890123456789这个也出过,
17位可能这个弱密码也被干掉了

DKblue 发表于 2017-11-5 21:02

随风飘 发表于 2017-11-5 20:48
01234567890123456789这个也出过,
17位可能这个弱密码也被干掉了

多谢多谢,俺真的疏忽了
再次感谢

上上网 发表于 2017-11-5 21:03

弱密不应该限制它位数

随风飘 发表于 2017-11-5 21:31

密码类型在于平时积累
仔细看还不少的

sdytygygjl 发表于 2017-11-6 14:55

感谢分享!学习了!

爱无线@ 发表于 2017-11-7 12:47

感恩 感谢!!!

devlam 发表于 2017-12-21 03:17

请问"去掉有13.15.18开头的手机号码" 如何操作?小白求教。

故乡-清风 发表于 2017-12-21 07:19

进来看看......

DKblue 发表于 2017-12-21 11:33

devlam 发表于 2017-12-21 03:17
请问"去掉有13.15.18开头的手机号码" 如何操作?小白求教。

上面正则都给了,你动动指头复制粘贴再添加个grep或者sed之类
都懒得动手???

child_cn 发表于 2017-12-21 15:05

菜鸟来学习学习
页: [1] 2 3
查看完整版本: 刚看随风大侠有感说两句字典处理