使用php采集阿里巴巴百万商户信息稳定版。该项目结合phantomjs,无需浏览器的情况下进行快速的“Web浏览”,相当于人为去浏览网页从而更好的渲染页面,提高数据抓取的准确率。此外,经过长期测试,对反爬虫进行特殊处理,运行稳定。
- 安装php5.6、mysql和composer(自行google)
-
用db.1688.init.sql文件创建数据库
-
在mysqli-open.php文件添加数据库信息
-
解压缩运行composer install
-
将cache和Robots拷贝到php-phantomjs-master目录
-
进入项目根目录bank运行 php 1688.php