爬虫工程师要求-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

爬虫工程师要求

阅读量：5314 次

发布时间：2019-06-14

本文共 472 字，大约阅读时间需要 1 分钟。

Python爬虫视频教程零基础小白到scrapy爬虫高手-轻松入门

工作职责：

- 参与分布式爬虫和数据采集系统的架构设计和开发；

- 负责网络数据抓取规划、清洗以及汇总的开发工作；

- 定期爬取指定网站的数据，为业务部门提供数据支持；

职位要求：

- 一年以上python开发经验，精通python网络编程，熟悉HTTP传输协议；

- 了解搜索和爬虫开源软件(lucene，solr，mathout，firtex，lemur，indri，nutch，haddopmlarbin，QT webkit)的一种或多种，以及相关原理；

- 精通网页抓取原理及技术，精通正则表达式，从结构化的和非结构化的数据中获取信息；

- 具备信息检索、web挖掘等搜索引擎相关知识，有从事网络爬虫、网页去重、网页信息抓取、网页分类中任一种程序开发经验；

- 熟悉NoSql（MongoDB，Redis，Hbase等），了解大数据，有一定的Hadoop使用经验。

转载于:https://www.cnblogs.com/webRobot/p/5575103.html

你可能感兴趣的文章

[Flex] flex手机项目如何限制横竖屏？只允许横屏？

tensorflow的graph和session

JavaScript动画打开半透明提示层

jquery-jqzoom 插件用例

1007. Maximum Subsequence Sum (25)

查看oracle数据库的连接数以及用户

【数据结构】栈结构操作示例

三.野指针和free

activemq5.14+zookeeper3.4.9实现高可用

TCP/IP详解学习笔记（3）IP协议ARP协议和RARP协议

简单【用户输入验证】

python tkinter GUI绘制，以及点击更新显示图片

20130330java基础学习笔记-语句_for循环嵌套练习2

Spring面试题

C语言栈的实现

代码为什么需要重构

TC SRM 593 DIV1 250

2018-2019-2 20165314『网络对抗技术』Exp5：MSF基础应用

Python-S9-Day127-Scrapy爬虫框架2

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-11-27 18:39:37 当前IP: 18.188.227.108 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我