刚上高一,家里送了台电脑,自学 PYTHON,遇到转码的问题,请教大家~~

2016-07-03 20:31:14 +08:00
 andmspy

代码如下: import requests from bs4 import BeautifulSoup

url = 'http://www.mnsfz.com/'

r = requests.get(url) soup = BeautifulSoup(r.text, 'lxml') print(soup.title)

输出:

<title>乱码乱码乱码乱码乱码乱码乱码乱码乱码乱码(论坛不能含有特殊字符)</title>

网页 charset 为‘ utf-8'

试过 decode('utf-8').encode('gbk') 输出: <built-in method title of str object at 0x03DC14F0>

请教如何输出纯中文字符 ‘美女私房网,美女图片,美女写真,性感美女,清纯少女,私房照,模特写真,模特私房’ 谢谢。

3790 次点击
所在节点    Python
22 条回复
practicer
2016-07-09 13:27:17 +08:00
小伙子,有出息
necomancer
2016-07-29 07:46:51 +08:00
print(soup.title.string.encode('latin-1').decode('utf-8')),编码不对啊
美女私房照_美女,写真,清纯,少女_私房照|美女私房照_美女写真,少女清纯写真照

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/290008

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX