爬虫工程师岗位职责

时间:2022-11-28 10:51:42 岗位职责 我要投稿

爬虫工程师岗位职责

  在现在社会,岗位职责使用的频率越来越高,制定岗位职责可以有效规范操作行为。那么你真正懂得怎么制定岗位职责吗?以下是小编精心整理的爬虫工程师岗位职责,希望能够帮助到大家。

爬虫工程师岗位职责

爬虫工程师岗位职责1

  职责描述:

  1、负责公司产品的爬虫架构设计与开发,以及爬虫策略优化等工作;

  2、根据数据产品需求,负责对网页等大规模文本数据抓取、清洗、存储等设计开发工作;

  任职要求:

  1、计算机、数学或统计等相关专业本科及以上学历,1年以上爬虫相关工作经验;

  2、熟悉linux平台,熟练掌握python或java爬虫开发工作;

  3、熟悉静态、动态网页等大规模文本数据的高效信息抽取、清洗、存储等技术;

  4、有反爬相关问题处理经验,精通常用的爬虫技术及架构设计,并能快速开发实现;

  5、具备良好的编程习惯和算法基础;

  6、善于学习,热爱技术开发,善于团队协作,能积极主动地参与公司产品研发等相关工作。职责描述:

  1、负责公司产品的爬虫架构设计与开发,以及爬虫策略优化等工作;

  2、根据数据产品需求,负责对网页等大规模文本数据抓取、清洗、存储等设计开发工作;

爬虫工程师岗位职责2

  职位描述:

  负责设计和开发分布式网络爬虫系统

  应用多种技术对各平台进行数据采集

  设计数据采集策略,提升数据采集效率及质量

  与各行业分析师沟通,分析项目的可行性和讨论抓取方案。

  两年以上爬虫开发相关经验,本科及以上学历,计算机相关专业为佳

  熟练掌握c#或java开发语言为佳

  了解tcp/ip,http及相关网络协议

  熟悉js / html / xpath / json /正则表达式等网页相关技术

  熟悉分布式、多线程、缓存、消息队列等互联网技术

  熟悉手机应用的数据抓取,手机app开发经验,加/脱壳经验为佳

  良好的沟通技能,注重细节,抗压性强

  良好的英语沟通技能为佳

爬虫工程师岗位职责3

  岗位职责

  1、熟悉线程池、并发机制、锁机制、线程安全原理;

  2、java体系知识:网络io、设计模式、linux、jvm、java类加载机制、java内存模型;

  3、爬虫经验:webmagic、adsl拨号、正则表达式、脱壳技术、加密、图片破解、二维码识别、滑块验证码破解、httpclient、分词、分布式爬虫调度、数据质量监控、代理ip调度算法、配置化爬虫、授权爬虫、舆情、应用市场、反爬;

  4、熟悉http/http、tcp/ip、socket等通讯协议;

  5、6年以上软件开发经验,至少2年爬虫开发经验。

  任职要求

  1、采集、清洗、监控、配置化、调度、反爬、数据爬取、分词、检索等数据采集研发;

  2、较强的逻辑思维和发散思维;

  3、计算机或相关专业本科及以上学历。

爬虫工程师岗位职责4

  职位描述:

  1、开发网页自动化脚本。

  2、负责商品信息结构化,编写自动化脚本解析网页信息。

  3、商品索引系统:亿级sku的库存价格实时跟踪同步,并对商品进行智能分类、本地化、图片处理和去重。

  4、设计、开发、测试、部署以及维护并改进各子系统;

  5、管理项目优先级并按时交付。

  职位要求:

  1、全日制统招本科、硕士毕业,1年以上软件开发工作经验;

  2、熟悉至少一门通用静态编译编程语言,c/c++/java/c#/go;

  3、熟悉web端基础标准,包括html、css、javascript、json等;

  4、熟悉python或其他脚本语言,有兴趣和能力根据需求学习其他编程语言;

  5、熟悉unix/linux环境,memcache/redis/mongodb等存储系统,能独立设计开发包括前后端交互的业务子系统;

  6、熟悉常见的'设计模式、单元测试、持续开发集成、code review,并能在日常工作践行;

  7、了解搜索引擎、电子商务、社交类应用的系统基本架构,能对已有的子系统进行优化调整的优先;

  8、活跃的开源项目贡献者优先。

爬虫工程师岗位职责5

  职位描述:

  1、参与爬虫系统的架构设计与开发;

  2、负责执行和开发分布式网络爬虫系统,进行多平台信息的抓取和分析;

  3、负责网页信息和app数据抽取、清洗、消重等工作,提升平台的抓取效率;

  4、参与爬虫核心算法和策略优化,熟悉采集系统的调度策略;

  5、实时监控爬虫的进度和警报反馈。

  任职要求:

  1、本科以上学历,3年以上爬虫开发相关经验,熟练使用python或java进行开发;

  2、熟练使用正则表达式、css path、xpath等,能够从结构化的和非结构化的数据中获取信息;

  3、熟练使用mysql数据库,掌握redis、mongodb、hive等常用nosql技术并具有实战经验;

  4、熟悉各种抓取技术,包括代理、phantomjs/selenium、验证码处理;

  5、熟悉整个爬虫的设计及实现流程,有从事网络爬虫、网页信息抽取开发经验,熟悉反爬虫技术,有分布式爬虫架构经验;

  6、具有数据挖掘、自然语言处理、信息检索、机器学习背景者优先;

  7、快速学习能力,工作积极主动,有创业热情和良好的团队协助能力;

  8、需要有大量数据爬取以及高难度反爬经验,没有相关经验的勿扰。

爬虫工程师岗位职责6

  工作内容:

  1、基础系统架构、模块、库和组件的研发;

  2、分布式海量数据存储和分析系统的研发和调优;

  3、统计分析、报表、saas业务等系统研发;

  4、crm、财务结算、工作流等内部管理系统的研发。

  能力要求:

  1、至少使用php/java/python等一门以上语言,开发过不算太小的项目;

  2、熟悉数据结构、db、os、web开发等相关知识,对linux相关的各类技术情有独钟;

  3、有大规模、高性能互联网网站系统相关的设计和开发经验者优先;

  4、具备良好的学习能力和成长潜力,渴望和团队一起快速成长。

爬虫工程师岗位职责7

  岗位职责:

  1、参与app爬虫项目的架构设计、研发工作,改进和提升爬虫效率;

  2、攻破各种反爬策略;

  3、解决各类技术疑难问题,包括网络问题、app分析、反编译等;

  4、与大数据工程师对接,完成实时数据与离线数据的爬取与对接;

  任职资格:

  1、计算机及相关专业本科及以上学历,两年以上相关工作经验;

  2、精通至少一种开发语言,如python、java;

  3、熟练掌握一种开源爬虫框架,如scrapy、webmagic,有研发爬虫框架经验者优先;

  4、熟悉appium、selenium等技术;

  5、善于独立分析并解决核心问题,如javascript反爬、爬虫策略、防屏蔽规则、app爬取、验证码识别技术等;

  6、熟悉mysql,?mongodb,?redis,?elasticsearch等数据库;

  7、对爬虫有浓厚的兴趣,责任感强,有较好的交流沟通能力和团队合作能力;

  8、有app安全、逆向等领域经验的优先;

爬虫工程师岗位职责8

  岗位职责:

  1、负责网络爬虫的架构设计、开发与优化;

  2、负责抓取数据的清洗、落地、分析;

  3、抓取策略算法的更新维护,以及确保数据抽取准确、高效。

  任职要求:

  1、两年及以上互联网或软件行业工作经验;

  2、理解http协议,熟悉html、dom、xpath;

  3、熟悉linux开发环境,至少熟悉python/go/java/node、js中的一种编程语言;

  4、有爬虫、信息抽取、文本分类、大数据处理相关经验优先;

  5、有自然语言处理、机器学习经验优先;

  6、熟悉浏览器内核、渲染机制优先;

  7、工作认真,细心,有条理,积极性高;良好的沟通能力及团队合作精神。

爬虫工程师岗位职责9

  职责描述:

  1、负责网络爬虫系统的设计与开发

  2、对爬取的网页信息进行数据抽取,清洗和去重等工作

  任职要求:

  1、2年及以上网络爬虫开发经验,本科及大专学历,计算机相关专业,

  2、积极、沟通顺畅,工作认真负责

  3、扎实的编程能力,熟悉常用算法和数据结构等基础知识

  4、熟练掌握开发语言java或c/c++,熟悉脚本语言和正则表达式

爬虫工程师岗位职责10

  职位描述:

  1、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作;

  2、负责网页信息和app数据抽取、清洗、消重等工作,提升平台的抓取效率;

  3、参与爬虫核心算法和策略优化,熟悉采集系统的调度策略;

  4、实时监控爬虫的进度和警报反馈。

  任职要求:

  1、有扎实的算法和数据结构能力;

  2、熟悉爬虫原理,熟悉常见的反爬虫技术,有爬虫相关项目开发经验者优先;

  3、掌握http协议,熟悉html、dom、xpath等常见的数据抽取技术;

  4、有大规模数据处理、数据挖掘、信息提取等经验者优先。

爬虫工程师岗位职责11

  职位要求

  1、计算机相关专业,本科及以上学历,3年以上爬虫相关工作经验;

  2、对爬虫编程有强烈爱好,熟练精通掌握至少1种语言java、python,在需要的情况下能快速上手新语言切换;

  3、深入理解tpc/ip、http、以及web登录认证的机制,有成功破解复杂验证码的经验;

  4、有通用分布式爬虫系统架构和开发经验,能快速部署新的爬虫应用;

  5、已有2年以上网络爬虫或搜索引擎工作经验,参与过大规模数据爬虫优先考虑;

  6、有app安全、逆向等领域的经验;

  7、具有良好的沟通、团队协作、计划能力,有过1—2人的团队管理经验。

  岗位职责

  1、建设完善分布式爬虫系统;

  2、建立通用的爬虫框架,能够快速适应新的爬虫需求;

  3、快速完成对目标资源的数据抓取、处理。

爬虫工程师岗位职责12

  职位描述:

  1、负责广告素材线索和垂直类产品爬虫系统的设计、开发

  2、抓取数据的清洗、落地、分析

  3、抓取策略算法的更新维护,以及确保数据抽取准确、高效

  任职要求:

  1、具备强悍的编码能力、扎实的数据结构和算法功底

  2、熟悉tcp,http协议原理;熟悉ajax工作原理;精通python编程,熟悉一种开源爬虫框架和源码;

  3、有爬虫、信息抽取、文本分类、大数据处理相关经验优先

  4、有自然语言处理、机器学习经验优先

【爬虫工程师岗位职责】相关文章:

《小爬虫》阅读答案01-09

小爬虫的启示作文11-24

小爬虫阅读答案10-06

无处不在的爬虫散文06-12

小爬虫的道理课文原文11-01

《小爬虫的道理》阅读答案09-24

小爬虫给我的启示小学作文05-19

《爬虫历险记》读后感02-17

工程师岗位职责11-03