联系我们

高级数据采集工程师

地点:杭州

薪资:40k-60k

推荐奖:6k-2w/人

关键词:数据采集

职位描述:
1. 遵循robots 协议,对互联网公开信息进行采集;
2. 负责网页信息抽取技术算法的研究和开发,提升数据采集的效率和质量;
3. 负责设计和开发分布式的网络数据采集技术,能独立解决实际开发过程碰到的各类问题(优化调度、并发、覆盖率等) ,提升数据采集的效果与性能;
4. 负责数据采集解析入库、系统异常监控与警报等。


任职要求:
1. 具备扎实的编程能力、优秀的设计能力和代码品味,具有强烈的责任心;
2. 熟练掌握HTML、JavaScript、Python、Scrapy等,能快速完成采集脚本的编写;
3. 了解主流网络数据采集技术和框架工具,如Selenium/Puppeteer/PhantomJS/Scrapy等;
4. 了解NLP基本技术,实际使用过如 Fasttext、N-gram、Bert、GPT 等算法和模型者优先;
5. 熟悉常见限制访问服务器资源和获取数据技术,具备相关的实战经验。

Have a thing for this job? Go for it and apply today! You got this!