详细内容:当前的位置：首页 >> 公开课

Python网络爬虫及数据采集技术培训

课程编号： 49236 查看文字版课程大纲

开课时间： 2017年2月23日　周四至 2017年2月24日　周五查看最新上课时间
开课城市：北京
培训时长：2天
课程类别： IT技能
主讲老师：杨老师（查看该老师更多课程）
课程编号： 49236

查找同类课程

课程价格：￥ 5500 元/位
会员价格：￥ 4400 元/位
立即报名
下载课程大纲

Python网络爬虫及数据采集技术培训其它上课时间：

培训对象：

1，系统架构师、系统分析师、高级程序员、资深开发人员。2，牵涉到网络采集、处理和规划的负责人、设计人员。3，政府机关，金融保险、移动等以互联网信息为数据来源单位的负责人。4，高校、科研院所牵涉到网络数据采集与数据处理的项目负责人。

培训内容：

课程大纲:

第一讲网络爬虫基础
1.什么是网络爬虫
2.浏览网页的过程
3.URL的含义
4.环境的配置
第二讲Python爬虫基础知识
1.Python爬虫基础学习
2.Pythonurllib和urllib2库的用法
3.Python正则表达式
4.BeautifulSoup简介
5.爬虫框架Scrapy
第三讲Urllib库的基本使用
1.网页爬取示例
2.网页爬取方法
3.构造Requset
4.POST和GET数据传送
第四讲Urllib库的高级用法
1.设置Headers
2.Proxy（代理）的设置
3.Timeout设置
4.HTTP的PUT和DELETE方法
5.使用DebugLog
第五讲正则表达式
1.了解正则表达式
2.正则表达式的语法规则
3.正则表达式相关注解
4.PythonRe模块
第六讲BeautifulSoup的用法
1.BeautifulSoup的简介
2.BeautifulSoup安装
3.创建BeautifulSoup对象
4.BeautifulSoup对象种类
5.遍历文档树
第七讲开始采集
1.遍历单个域名
2.采集整个网站
3.通过互联网采集
4.用Scrapy采集
5.几个示例
第八讲存储数据和读取文档
1.媒体文件
2.把数据存储到CSV
3.MySQL与Python整合
4.读取纯文本和CSV文档
5.读取Word和.docx
第九讲自然语言处理基础
1.概括数据
2.马尔可夫模型
3.自然语言工具包
4.用NLTK做统计分析
5.用NLTK做词性分析
第十讲用爬虫测试网站
1.测试简介
2.Python单元测试
3.Selenium单元测试
4.Python单元测试与Selenium单元测试的选择

培训师介绍：

杨老师。
主要研究网络信息分析以及云计算相关技术，长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作，主持和参与了多个国家和省部级基金项目，具有丰富的工程实践及软件研发经验。

相关 Python网络爬虫及数据采集技术培训 , Pyt, 课程：点击查看更多相关课程

关于举办Python Web开发与爬虫实践培训班的通知
刘老师
2019/7/17
北京
全国高校大数据（Hadoop、spark、Python）师资
张老师
2019/4/20
上海
Python大数据机器学习实战
张老师
2019/4/26
上海
Python核心编程培训班
专家
2019/1/14
北京
python+人工智能高级实战
专家
2018/5/17
北京
Python语言基础及数据分析技术培训
杨老师
2017/3/23
北京
Python语言基础及数据分析技术”
待定
2017/3/23
北京
Python网络爬虫及数据采集技术培训
杨老师
2017/2/23
北京
Python网络爬虫及数据采集技术
待定
2017/2/23
北京
Python和R数据挖掘技术-基于Python和R语言的数据挖掘和统计分析技术培训
杨老师
2017/3/23
北京
Python数据分析入门：数据挖掘实战（直播）
Gary
2016/2/18
深圳
python基础教程
何家胜
2013/11/6
北京

Python网络爬虫及数据采集技术培训

培训对象：

培训内容：

课程大纲:

培训师介绍：

IT技能推荐讲师

IT技能公开课推荐

IT技能精品内训推荐

最新发布公开课推荐

博课在线客服关闭