国内最专业的IT技术学习网

UI设计

当前位置:主页 > UI设计 >

20行Python代码批量抓取免费高清图片!

发布时间:2019/07/29标签:   图片    点击量:

原标题:20行Python代码批量抓取免费高清图片!
信任在你的任务中能够会常常用到PPT吧,你在PPT制造进程中有没有如许的迷惑,就是能够到那里找到既高清又无版权争议的图片素材呢?这里激烈推举ColorHub,这是一个同意团体和贸易用处的收费图片网站,真的很赞!从她的主页界面来看,兴许你就会爱上她。那末,怎样将网站中的图片存储到当地呢(比方比拟关怀跟数据相干的素材)?假如做到了,便可以在没有收集的情形下,随心所欲的抉择优美图片制造PPT,随时随地的检查本人的图片库。而本文所要跟各人分享的就是这个成绩的处理计划。爬虫思绪咱们晓得,关于图片网站的抓取,每每须要经由三层网页链接,为了可能直观地舆解这三层链接,能够检查下图:顶层页:是指经过网站主页的搜寻栏,搜寻出感兴致的图片偏向,便进入到的图片列表页,它的模样是如许的:次层页:是指导击图片列表页中的某张图片,转而对应到的图片概况页,它的模样是如许的:目的页:最初就是为了抓取图片概况页中的那张高清图片,而这张图片在网页源代码中就是一个图片链接,它的模样是如许的:以是,爬虫抓取图片的终极目标就是找到高清图片所对应的链接。接上去将经过代码的先容,浮现三层链接的查找和恳求进程。1#导入第三方包2importrequests3frombs4importBeautifulSoup4importrandom5importtime6fromfake_useragentimportUserAgent78#经过轮回完成多页图片的抓取9forpageinrange(1,11):10#天生顶层图片列表页的链接11fst_url=rhttps://colorhub.me/search?tag=data&page={}.format(page)12#天生UA,用于爬虫恳求头的设置13UA=UserAgent()14#向顶层链接发送恳求15fst_response=requests.get(fst_url,headers={User-Agent:UA.random})16#剖析顶层链接的源代码17fst_soup=BeautifulSoup(fst_response.text)18#依据HTML的标志规矩,前往次层图片概况页的链接和图片称号19sec_urls=[i.find(a)[href]foriinfst_soup.findAll(name=div,attrs={class:card})]20pic_names=[i.find(a)[title]foriinfst_soup.findAll(name=div,attrs={class:card})]21#对每一个次层链接做轮回22forsec_url,pic_nameinzip(sec_urls,pic_names):23#天生UA,用于爬虫恳求头的设置24UA=UserAgent()25ua=UA.random26#向次层链接发送恳求27sec_response=requests.get(sec_url,headers={User-Agent:ua})28#剖析次层链接的源代码29sec_soup=BeautifulSoup(sec_response.text)30#依据HTML的标志规矩,前往图片链接31pic_url=https:+sec_soup.find(img,{class:card-img-top})[src]32#对图片链接发送恳求33pic_response=requests.get(pic_url,headers={User-Agent:ua})34#将二进制的图片数据写入到当地(即存储图片到当地)35withopen(pic_name+.jpg,mode=wb)asfn:36fn.write(pic_response.content)37#天生随机秒数,用于也没的停顿38seconds=random.uniform(1,3)39time.sleep(seconds)

版权信息Copyright ? IT技术教程 版权所有??? ICP备案编号:鲁ICP备09013610号