使用xpath提取页面所有a标签的href属性值

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

慷慨大方的铁板烧 · 戒魔人漫画全 - 抖音· 1 年前 ·

犯傻的沙滩裤 · 袁术（漫画《火凤燎原》及其衍生作品角色）_百度百科· 1 年前 ·

年轻有为的毛衣 · 耿鬼皮卡丘_耿鬼皮卡丘合体_耿鬼皮卡丘手办 ...· 1 年前 ·

笑点低的水煮肉 · 成吉思汗之女阿剌海别吉身为监国，处理国事有条 ...· 1 年前 ·

沉着的抽屉 · 西里尔兄弟，保加利亚斯拉夫文字创造和传播—— ...· 1 年前 ·

#获取所有带有id属性的div //div[@id] #2.谓词(索引从1开始) #获取body下面的第一个/最后一个div元素/前两个 //body/div[1] //body/div[last()] //body/div[position<3] #获取具有class='price'属性的div标签 //div[@class='price'] #3.通配符 # * | #4.运算符 and or import requests from lxml import etree url = "http://www.baidu.com" resp = requests.get(url) resp.encoding="utf-8" html = etree.HTML(resp.text) #获取所有a标签的href属性 linklist = html.xpath("//a/@href") for item in linklist: print(item)

推荐文章

慷慨大方的铁板烧 · 戒魔人漫画全 - 抖音

1 年前

犯傻的沙滩裤 · 袁术（漫画《火凤燎原》及其衍生作品角色）_百度百科

1 年前

年轻有为的毛衣 · 耿鬼皮卡丘_耿鬼皮卡丘合体_耿鬼皮卡丘手办 - 抖音

1 年前

笑点低的水煮肉 · 成吉思汗之女阿剌海别吉身为监国，处理国事有条不紊，经历四次婚姻_汪古部_尼沙_铁木真

1 年前

沉着的抽屉 · 西里尔兄弟，保加利亚斯拉夫文字创造和传播——保加利亚简史11 ...

1 年前