利用python爬电话号码整理成字典
本帖最后由 ahkxhyl 于 2016-12-22 14:58 编辑看了几天python手册,python刚入门,昨天发现个专门电话号码网站,就想用python爬下来做成字典~~
爬取得网站:http://www.nowdl.cn/city/jiangsu/wuxi.php
2个文件
number.py 整理号码段 需要改的按标注修改
phone.py对number.py生成的号码段进行详细内容爬取整理成一个文件(字典)
使用说明:
需要安装python环境
运行格式 [按执行先后顺序 其他自行研究~太懒 没有做更高级更智能点的了]
python number.py
python phone.py
测试过上海 无锡 号码段,,整理的话 需要时间比较长~耐心等待即可 我一般用公司电脑跑一夜即可 做这个功能只是方便自己做字典 写完就分享下~~
写了半天 边测试边写 收个辛苦钱 不过分吧 喜欢就下 不喜欢就不下 ~~勿喷 哈哈
爬出来的号码段
整理成的字典
本帖最后由 ahkxhyl 于 2016-12-22 16:19 编辑
上上网 发表于 2016-12-22 16:10
能将号段数据放出来么
http://www.nowdl.cn/all.html 这个是全部城市的
http://www.nowdl.cn/city/beijing/beijing.php 比如这个是北京号码段
其他的 方法一样
需要注意的是:
里面的链接 需要对应修改。。保存的文件名对应修改即可~~
是全部的还是只是上海无锡的? 不是路人饼 发表于 2016-12-22 15:09
是全部的还是只是上海无锡的?
我自己只是测试了无锡 上海的~~其他地区没测试~~ 提供的只是处理工具 而不是字典~~ 搞个广东的字典给我行不? 不是路人饼 发表于 2016-12-22 15:36
搞个广东的字典给我行不?
工具都提供了 还要我整理 没搞错? ahkxhyl 发表于 2016-12-22 15:49
工具都提供了 还要我整理 没搞错?
。。。。。。。。。。。。。。。。。。。 本帖最后由 上上网 于 2016-12-22 16:06 编辑
上上网 发表于 2016-12-22 15:55
里面需要改的地方我有标注~按需修改就可以了~ ahkxhyl 发表于 2016-12-22 16:09
里面需要改的地方我有标注~按需修改就可以了~
能将号段数据放出来么 一个来那得什么时候啊,直接历遍扒下来多好 上上网 发表于 2016-12-22 16:26
一个来那得什么时候啊,直接历遍扒下来多好
:lol 我只是学python用的~~ 当初只是想爬我现在所在城市。。没想爬全国 。。爬全国感觉1个星期都不知道能不能搞定~~
页:
[1]
2