微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用VB.Net访问html标签源html中的元素

我在我的Vb.Net WinForms应用程序中使用SHDocVw.InternetExplorer API从Internet Explorer获取元素.我可以轻松访问父文档和框架元素中的元素,但我无法访问’embed’容器中的元素.这是示例代码

Dim ie As SHDocVw.InternetExplorer
    ie.Navigate("Some URL")
    ie.Visible = True
    Dim ieDoc As mshtml.IHTMLDocument2 = ie.Document

    'All Elements
    Dim allElements = ieDoc.all

    'Frames
    Dim allFrames = ieDoc.frames

    'Fetch each frame and use its document to get all elements

    Dim allEmbed = ieDoc.embeds

    'How to fetch document inside embed to access its elements?

这是一个示例html:

Sample.html

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
	<title>Sample</title> 
</head>
<body>
	<embed src="test.html" name="test1"/>	
</body>
</html>

的test.html

<html xmlns="http://www.w3.org/1999/xhtml">
<head>
	<title>Sample</title> 
</head>
<body bgcolor="#FFFFFF">
	<button>Button1</button>
	<label>Test 1</label>
</body>	
</html>

如何使用’embed标签访问Sample.html中加载的Test.html内的按钮和标签

编辑1:

根据我的研究,我可以使用’object’元素的.contentDocument属性访问’object’容器内的文档,但同样不适用于’embed’容器.

我可以在’embed’容器上使用getSVGDocument()属性获取一些comObject但不能将其强制转换为mshtml.IHTMLDocument2

解决方法

好吧,我一直在使用“Html Agility Pack”在这里解析HTML,它非常棒,
您可以在页面获取所有嵌入元素,并读取/解析内部内容.
http://html-agility-pack.net/

我的样本:

'<html xmlns='http://www.w3.org/1999/xhtml'>
'<head>
'    <title>Sample</title> 
'</head>
'<body>
'    <embed src='https://stackoverflow.com/questions/41806246/access-elements-inside-html-embed-tag-source-html-using-vb-net' name='test1'/>
'</body>
'</html>
'The htmlCode string:

Dim htmlCode As String = "<html xmlns='http://www.w3.org/1999/xhtml'><head><title>Sample</title></head><body><embed src='https://stackoverflow.com/questions/41806246/access-elements-inside-html-embed-tag-source-html-using-vb-net' name='test1'/></body></html>";

Dim client As New WebClient()

Dim doc = New HtmlDocument()
doc.LoadHtml(htmlCode)

Dim nodes = doc.DocumentNode.Descendants("embed")

For Each item As var In nodes
    Dim srcEmded = item.GetAttributeValue("src","")

    If Not String.IsNullOrWhiteSpace(srcEmded) Then

        Dim yourEmbedHtml As String = client.DownloadString(srcEmded)
        'Do what you want with yourEmbedHtml

    End If
Next

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐