我需要在txt文件中保存任何网站的
HTML代码,这是一个非常简单的练习,但我对此有疑问,因为有一个函数可以做到这一点:
import urllib.request def get_html(url): f=open('htmlcode.txt','w') page=urllib.request.urlopen(url) pagetext=page.read() ## Save the html and later save in the file f.write(pagetext) f.close()
但这不起作用.
解决方法
最简单的方法是使用
urlretrieve:
import urllib urllib.urlretrieve("http://www.example.com/test.html","test.txt")
对于Python 3.x,代码如下:
import urllib.request urllib.request.urlretrieve("http://www.example.com/test.html","test.txt")