这是我的第一次原创文章,其中借鉴和采用了诸位网友的建议和思想,在这里表示感谢,也希望大家能从本文中受益。本文适合Visual Basic语言的同志,特别是Visual Basic 2005的朋友们借鉴。
如果我们要把一个网页保存为text格式的内容,换而言之,将网页的内容转换成文本文件以方便以后的使用,我们可以通过以下几个步骤:
第一,将该网页文件(假定你的本地硬盘已经有了某网站的一个网页文件test.asp)直接改名为test.txt,然后双击打开该文件,看看内容是否我们需要的。如果里面没有脚本语言(如vbscript,java等等)的符号,诸如:<a href = ...>Link Text</a>,那么恭喜您,你可以通过visual basic 2005的文件处理模块,如my.computer.io,很方便地把所有该类型文页文件的扩展名直接改为.txt就万事大吉了!
第二,如果出现了上面提到的不幸情况,你要费一番工夫,通过编程的一系列操作来完成。有的网友建议逐行分析,去除<>/等脚本语言特有的符号,这种方法经实践比较笨拙且不通用;有位网友通过摸索提供了一个思路,结合自己的实践,总结如下:首先,建立一个新的项目及Form1,然后在上面放置一个Webbrowser1和RichTextBox1,一个Button1控件,然后,双击按钮控件,键入如下代码:
WebBrowser1.Nevigate("F:\test.asp") '该语句用来打开要转换的网页文件
然后在WebBrowser1_ProgressChange()事件中加入以下代码,用来将需要文本内容显示出来:
RichTextBox1.Text = WebBrowser1.Document.body.innertext
然后,根据需要你可以进行其他的操作,如批量打开网页文件,.循环转换等;你也可以将该内容直接写入文件而不必显示在RichTextBox1控件中。
大家有什么好的办法,请留言交流,谢谢你的支持。
评论