大规模文本信息提取

开源众包 Technology & Programming China
981 days ago

Description

目标网站:

http://htgs.ccgp.gov.cn/GS8/contractpublish/search



要求;

1. 保证获取率和准确率至少在95%以上

2. Python完成,代码要有清晰的注释

3. 有类似项目完成经验





最终交付:

所有源码;提取结果(见上传样例)



注意:

百万级数据量,该项目重点在于信息提取,而非爬取网页(其实爬取非常简单)





时间要求;

14天(可议)



关注公众号,不定期副业成功案例分享
Follow WeChat

Success story sharing

Want to stay one step ahead of the latest teleworks?

Subscribe Now

Similar Teleworks