在写爬虫时定位标签位置获取想要的数据是匹配工作的重点。通过class或id选择器的值(属性值要求在网页中是唯一的)可以很快的实现标签的定位
不做任何处理,选择整個标签class的属性值(一个都不能少)但是这个方法很多时候没有普适性,很容易出错而且也代码也看的很乱。----------不建议这样使用用这个方法,还不如往前找一个父级标签然后用路径定位到这个标签呢
从字面意思上理解就是,判断是否包含一个元素所以定位用来判断的這个元素一定要是唯一的,不然实现不了你想要标签的定位
用法:contains(你要的属性值如class,class中的每一个值)
如上述就是判断span标签中的class是否包含vote-post-up值,如果包含就返回该标签在网页中的位置
有了这个位置之后你在确定后面是取值还是仍要进一步的往下定位。