已有 914 人访问
颜岩 ID.13708
博客(3)
颜岩的博客

1、在pycharm中安装selunium:先进入路径:File-settings-Project-ProjectInterpreter点击右侧+号,在弹出的对话框中输入:selenium,点击installpackage。等一段时间,selenium就算安装完成了,如下图:2、下载谷歌驱动,驱动需要与浏览器版本对应,下载地址:http://npm.taobao.o
150°/1500 人阅读/0 人点赞/0 条评论

HTTP(超文本传输协议),是计算机之间的通信规则HTTP请求信息和响应信息的格式HTTP请求信息格式:1、请求行1)请求方法:GET、POST、HEAD、PUT、DELETE、TRACE、OPTIONS2)请求路径3)所用协议2、请求头:格式为key:value3、空行4、请求主体:发送内容,可以为空
152°/1524 人阅读/0 人点赞/0 条评论

1、爬虫过程:url-发送请求,获取响应-提取数据-保存-发送请求,获取响应-提取url2、requests中解决编解码的方法:(1)response.content.decode()(2)response.content.decode('gbk')(3)response.content.decode('utf-8')(4)response.t
150°/1509 人阅读/0 人点赞/0 条评论