网上有很多关于基于selenium的python方法使用chrome浏览器打开和关闭网址,但是selenium需要安装相应的驱动,略显繁琐,而且不带Cookie,那么就需要重新登录,复杂化了整个过程,本文代码不需要安装selenium,使用使用基本操作打开谷歌浏览器。 获取代码请阅读全文。

2021-03-22 159点热度 0人点赞 阅读全文

有时我们需要将多个重复的挨着的字符串只保留一个,比如在写爬虫时有时会遇到多个换行的情况,多个多余的换行可能并不是我们想要的结果,我们可能只需要保留一个换行就行了。例如</br></br></br></br>转为</br> 例如ababab->ab 如果我们只需要将连续的ab只保留一个 例如bababc->babc nbgf</br></br></br></br></br></br…

2021-02-21 51点热度 0人点赞 阅读全文

1.使用“\d+”匹配全数字 代码: import re zen = "Arizona 479, 501, 870. Carlifornia 209, 213, 650." m = re.findall("\d+", zen) print(m) 结果: ['479', '501', '870', '209', '213', '650'] 但是上述这种方式也会引入非纯数据,例子如下: import re zen = "Arizona 479, 501, 870. Carlifornia 209, 213, 6…

2021-02-15 54点热度 0人点赞 阅读全文

一、charles简介   Charles 是常用的网络封包截取工具,在做 移动开发时,我们为了调试与服务器端的网络通讯协议,常常需要截取网络封包来分析。   Charles 通过将自己设置成系统的网络访问代理服务器,使得所有的网络访问请求都通过它来完成,从而实现了网络封包的截取和分析。   除了在做移动开发中调试端口外,Charles 也可以用于分析第三方应用的通讯协议。配合 Charles 的 SSL 功能,Charles 还可以分析 Https 协议。 二、charles安装    cha…

2021-02-09 90点热度 0人点赞 阅读全文

selenium 隐藏窗口执行 浏览器后台运行 拿Chrom浏览器举例,正常我们是用webdriver.Chrome()调用浏览器后台运行只需要在调用前加上亮行代码然后在调用浏览器的代码参数里引用我们设置的option就好了 option=webdriver.ChromeOptions() option.add_argument('headless') # 设置option driver = webdriver.Chrome(chrome_options=option) # 调用带参数的谷歌浏览器 整个世界都清静了

2021-01-23 109点热度 3人点赞 阅读全文

有时候我们在用python进行爬取网页信息的时候,可能会获取到一些不需要的空标签,这个标签可能并不是我们想要的 例如 <div><p>hello </p><p></p><p> world</p></div> 其中的<p></p>内容为空的标签就不是我们想要的,那么我们怎么样进行删除内容为空的标签,好像并没有什么很好的资料进行说明 本文提供了一个删除内容为空的标签的函数 效果如下 <div><p>hello </p><p>…

2020-12-10 160点热度 2人点赞 阅读全文

UA随机动态生成

2020-12-01 214点热度 1人点赞 阅读全文

2020-11-28 107点热度 2人点赞 阅读全文