博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
爬虫工程师要求
阅读量:5314 次
发布时间:2019-06-14

本文共 472 字,大约阅读时间需要 1 分钟。

Python爬虫视频教程零基础小白到scrapy爬虫高手-轻松入门

工作职责:

- 参与分布式爬虫和数据采集系统的架构设计和开发;

- 负责网络数据抓取规划、清洗以及汇总的开发工作;

- 定期爬取指定网站的数据,为业务部门提供数据支持;

职位要求:

- 一年以上python开发经验,精通python网络编程,熟悉HTTP传输协议;

- 了解搜索和爬虫开源软件(lucene,solr,mathout,firtex,lemur,indri,nutch,haddopmlarbin,QT webkit)的一种或多种,以及相关原理;

- 精通网页抓取原理及技术,精通正则表达式,从结构化的和非结构化的数据中获取信息;

- 具备信息检索、web挖掘等搜索引擎相关知识,有从事网络爬虫、网页去重、网页信息抓取、网页分类中任一种程序开发经验;

- 熟悉NoSql(MongoDB,Redis,Hbase等),了解大数据,有一定的Hadoop使用经验。

转载于:https://www.cnblogs.com/webRobot/p/5575103.html

你可能感兴趣的文章
[Flex] flex手机项目如何限制横竖屏?只允许横屏?
查看>>
tensorflow的graph和session
查看>>
JavaScript动画打开半透明提示层
查看>>
jquery-jqzoom 插件 用例
查看>>
1007. Maximum Subsequence Sum (25)
查看>>
查看oracle数据库的连接数以及用户
查看>>
【数据结构】栈结构操作示例
查看>>
三.野指针和free
查看>>
activemq5.14+zookeeper3.4.9实现高可用
查看>>
TCP/IP详解学习笔记(3)IP协议ARP协议和RARP协议
查看>>
简单【用户输入验证】
查看>>
python tkinter GUI绘制,以及点击更新显示图片
查看>>
20130330java基础学习笔记-语句_for循环嵌套练习2
查看>>
Spring面试题
查看>>
C语言栈的实现
查看>>
代码为什么需要重构
查看>>
TC SRM 593 DIV1 250
查看>>
SRM 628 DIV2
查看>>
2018-2019-2 20165314『网络对抗技术』Exp5:MSF基础应用
查看>>
Python-S9-Day127-Scrapy爬虫框架2
查看>>