博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
XPATH中text()和string()的使用区别
阅读量:6963 次
发布时间:2019-06-27

本文共 1788 字,大约阅读时间需要 5 分钟。

Delaware VIP® Diversified Income Series (Service Class): Maximum long-term total return consistent with reasonable risk.
Delaware VIP® Emerging Markets Series (Service Class): Long-term capital appreciation.
Delaware VIP® Limited-Term Diversified Income Series (Service Class): Maximum total return, consistent with reasonable risk.
Delaware VIP® REIT Series (Service Class): Maximum long-term total return, with capital appreciation as a secondary objective.
Delaware VIP® Small Cap Value Series (Service Class): Capital appreciation.
Delaware VIP® Smid Cap Core Series (Service Class): Long-term capital appreciation.
Delaware VIP® U.S. Growth Series (Service Class): Long-term capital appreciation.
Delaware VIP® Value Series (Service Class): Long-term capital appreciation.

在上面的Html表格中,我们要抓出每个tr标签中第2个td的文本内容,一开始想到的XPATH语句是这么写的:

//td[contains(text(),':') and contains(text(),'(') and contains(text(),')') and (contains(text(),'Class') or contains(text(),'Shares'))]

结果发现提不出来,将text()函数改为string()函数,就可以提出来了:

//td[contains(string(),':') and contains(string(),'(') and contains(string(),')') and (contains(string(),'Class') or contains(string(),'Shares'))]

原文档中有些td标签文本有换行,而且可能还夹杂着其他子标签,这时候可能用text()提取不出来,可以改用string(),string()可以将所有子标签中的文本串成一起提出来,可以满足绝大部分时候的需求。

 

转载于:https://www.cnblogs.com/JTCLASSROOM/p/11023284.html

你可能感兴趣的文章
html生成pdf
查看>>
项目进度管理与项目陈本管理
查看>>
LinearLayout的隐藏与显示
查看>>
Android studio使用自定义的格式化文件或者eclipse的格式文件
查看>>
sublime px dp vw换算rem
查看>>
NYOJ 16 矩形嵌套(动态规划)
查看>>
eclipse导入tomcat 8.0x源码
查看>>
shell脚本——爬取域名一级页面元素并判断其可缓存性
查看>>
Linux平台下代理服务器的实现(squid)
查看>>
简单的tab切换
查看>>
yii中文显示
查看>>
四层和七层负载均衡
查看>>
2016清单
查看>>
从一个多层嵌套循环中直接跳出(先想想自己代码设计的是否合理)
查看>>
linux升级内核
查看>>
安卓仿微信右上角弹出菜单窗口
查看>>
PVS让存储颤抖,系列博文之三:PVS的写缓存新技术之Win7桌面实测篇
查看>>
Java控制车速
查看>>
传入含中文的字符串 返回中文首字母
查看>>
thinkphp5 下 Linux 定时任务
查看>>