如何获取href标签中的内容 python 获取a中的href

如何Xpath获取一个标签中所有子标签里的href?
[问题点数:30分,结帖人Maxwelll_]
如何Xpath获取一个标签中所有子标签里的href?
[问题点数:30分,结帖人Maxwelll_]
不显示删除回复
显示所有回复
显示星级回复
显示得分回复
只显示楼主
匿名用户不能发表回复!|python获取指定标签中的内容_百度知道
python获取指定标签中的内容
我想使用python 将下面内容多个&string&&/string&之间的内容答应出来,应该如何编写脚本,顺便能给下讲解步骤和用到的python库或函数,谢谢
&key&LogType&/key&
&string&Default&/string&
&key&Message&/key&
&string&测试场景:订餐...
希望得到的结果是:测试场景:订餐提交页面”重复的只在其第一次显示的时候打印出来就行.266s另外说明:&string&Default&lt:0:订餐提交页面Loop in : 2 durT/string&是不需要显示出来的,还有我的文件中包含多个“测试场景
我有更好的答案
/key&&i&in&range(length):&&&&print&&&&&/string&&&&&&&&&&key&integer&1&/integer&gt:&nbsp,代码很容易懂的;key&Timestamp&''&trs[i].contents需要安装BeautifulS&/key&gt:16:24Z&&nbsp:订餐提交页面&&&coding:&utf-8&2&durTime:0.266s&/string&&&&&&/date&&&&&&&&&&key&&/string&&&&&&&&&&string&Loop&in&;&soup=&BeautifulSoup(html)trs=soup.findAll(&string&)length=len(trs)arr=[]for&&/dict&'&nbsp你好:请看下面代码:#&-*-&&Message&/key&&&&&&&&&&string&测试场景;&&date&LogType&/key&&&&&&&&&&string&Default&Type&&BeautifulSouphtml=''T12;&&&'&dict&&&&&&&&&&key&&import&-*-from&bs4&&lt
你好,我这个文件不是一个html文件,他是一个pilist文件,我用的方法是读出想要的内容但是都是unicode编码,我的脚本开头也有“#coding:utf-8”,请问如何处理呀?
采纳率:64%
为您推荐:
其他类似问题
您可能关注的内容
python的相关知识
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。15被浏览15,294分享邀请回答62 条评论分享收藏感谢收起3添加评论分享收藏感谢收起写回答5被浏览212分享邀请回答0添加评论分享收藏感谢收起在 SegmentFault,学习技能、解决问题
每个月,我们帮助 1000 万的开发者解决各种各样的技术问题。并助力他们在技术能力、职业生涯、影响力上获得提升。
问题对人有帮助,内容完整,我也想知道答案
问题没有实际价值,缺少关键内容,没有改进余地
先附上数据:
&div class="p-name p-name-type-2"&
&a target="_blank" title="Apple iPhone 6 (A1589) 16GB 金色 移动4G手机" href="//item.jd.com/1217493.html" onclick="searchlog(1,,1,'','flagsClk=4194952')"&
&em&Apple &font class="skcolor_ljg"&iPhone&/font& &font class="skcolor_ljg"&6&/font& (A1589) 16GB 金色 移动4G手机&/em&
&i class="promo-words" id="J_AD_1217493"&&/i&
用bs想要爬取title和href里面的内容,由于初学试了好几种办法,未果。先附上代码:
第一次尝试:
#!/usr/bin/python
2 #coding:utf-8
3 from bs4 import BeautifulSoup
4 import re
7 soup = BeautifulSoup(open('jd.html'),"lxml") #已经爬下的页面(上面代码为其中一段)
8 reg=u"(title=.*?\w+[\u4e00-\u9fa5]+)"
9 Res = re.compile(reg)
10 source = soup.find_all(class_ = 'p-name p-name-type-2',text=Res)
11 for item,nu in enumerate(source):
print item,nu
#!/usr/bin/python
7 soup = BeautifulSoup(open('jd.html'),"lxml")
8 source = soup.find_all(class_ = 'p-name p-name-type-2')
9 Res = source.body.contents[0].attrs
10 Title = Res['title']
11 Link = Res['href']
初学乍道有许多不理解,而且想用python做毕业设计所以还希望有高人能帮忙指点一下,
感激不尽!
注:爬取的页面为:view-source:
答案对人有帮助,有参考价值
答案没帮助,是错误的答案,答非所问
你的定位有问题, 按照你的第三种改了改如下:
Ln [19]: a
=soup.find_all('div',{'class': 'p-name-type-2'})[0].find_all('a')[0]
In [20]: print a['href']
//item.jd.com/1217493.html
In [21]: print a['title']
Apple iPhone 6 (A1589) 16GB 金色 移动4G手机
另外,如果要用BeautifulSoup 就别用正则了;正则,Bs, xpath 选择一个就好。
同步到新浪微博
分享到微博?
关闭理由:
删除理由:
忽略理由:
推广(招聘、广告、SEO 等)方面的内容
与已有问题重复(请编辑该提问指向已有相同问题)
答非所问,不符合答题要求
宜作评论而非答案
带有人身攻击、辱骂、仇恨等违反条款的内容
无法获得确切结果的问题
非开发直接相关的问题
非技术提问的讨论型问题
其他原因(请补充说明)
我要该,理由是:
在 SegmentFault,学习技能、解决问题
每个月,我们帮助 1000 万的开发者解决各种各样的技术问题。并助力他们在技术能力、职业生涯、影响力上获得提升。}

我要回帖

更多关于 python 获取p标签内容 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信