VerySource

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
楼主: kingfrog

VC下提取HTML中的文本内容!在线等!急!多多指点啊!

[复制链接]

0

主题

1

帖子

2.00

积分

新手上路

Rank: 1

积分
2.00
发表于 2020-8-23 00:45:01 | 显示全部楼层
const string  ExtractHTML( const string& strHTML )
{
string strTemp = strHTML;
while( true )
{
size_t szPos = strTemp.find( "<" );
if( string::npos == szPos )
return strTemp;
size_t szEnd = strTemp.find( ">", szPos );
if( string::npos == szEnd )
return strTemp;
strTemp.erase( szPos, szEnd - szPos + 1 );
}
}
---------------------------
请教:下面的HTML代码利用这个函数解析出来的是什么东东?
<pre>
if(i < 0 || i > 1000)
{
...
}
</pre>
回复

使用道具 举报

0

主题

4

帖子

5.00

积分

新手上路

Rank: 1

积分
5.00
发表于 2020-8-23 02:15:01 | 显示全部楼层
IHTMLElement::innerText
回复

使用道具 举报

0

主题

1

帖子

2.00

积分

新手上路

Rank: 1

积分
2.00
发表于 2020-8-24 10:15:01 | 显示全部楼层
占用帖子问下,你们这样得到的只是个字符串,能得到这串字符串在本地上什么时候分行吗?也就是说如何得到本地的换行标记,难道要自己写算法实现?
回复

使用道具 举报

0

主题

3

帖子

3.00

积分

新手上路

Rank: 1

积分
3.00
发表于 2020-8-24 10:30:01 | 显示全部楼层
你可以用DOM树来解析就可以啊!
回复

使用道具 举报

0

主题

3

帖子

3.00

积分

新手上路

Rank: 1

积分
3.00
发表于 2020-8-24 10:45:01 | 显示全部楼层

首先你先创建一个接点(createElement)和属性,然后用get_style和put_cssText,
再用IHTMLDOMNode中的appendChild函数就可以了啊!
回复

使用道具 举报

0

主题

1

帖子

2.00

积分

新手上路

Rank: 1

积分
2.00
发表于 2020-8-25 18:30:01 | 显示全部楼层
用CString 的 方法实在太不优雅了.

起码要用正则才对得起程序员的称号啊.

楼主,你的Html是一个纯文件,还是ie上面的一个网页,还是其他内嵌Internet_Explorer Server的程序,或者最简单的只是你程序中用CHtmlView显示的html?
回复

使用道具 举报

0

主题

1

帖子

2.00

积分

新手上路

Rank: 1

积分
2.00
发表于 2020-8-25 20:45:02 | 显示全部楼层
IHTMLElement::innerText
怎么使用啊?还没入门呢,请教一下
回复

使用道具 举报

0

主题

2

帖子

2.00

积分

新手上路

Rank: 1

积分
2.00
发表于 2020-8-25 21:00:01 | 显示全部楼层
有规则的,直接自己写就可以...
回复

使用道具 举报

0

主题

2

帖子

2.00

积分

新手上路

Rank: 1

积分
2.00
发表于 2020-8-25 21:15:01 | 显示全部楼层
直接查找特征字符串A,取到特征字符串B结束,添加格式
再继续
回复

使用道具 举报

0

主题

3

帖子

3.00

积分

新手上路

Rank: 1

积分
3.00
发表于 2020-8-25 21:30:01 | 显示全部楼层
你用DOM树解析, mshtml中找 IHTMLElement::innerText 这个应该就可以
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|CopyRight © 2008-2023|verysource.com ( 京ICP备17048824号-1 )

快速回复 返回顶部 返回列表