pandas读取excel出现乱码问题解决

文章目录

问题描述问题解决方式一：方式二参考链接

问题描述

读取 excel ，却出现了如下错误。

 u'1.G1P0\u5b5539+6\u5468LOA\u5355\u6d3b\u80ce\u987a\u4ea72.\u598a\u5a20\u671f\u7cd6\u5c3f\u75c53\u3001\u4f1a\u9634I\u5ea6\u88c2\u4f244.

问题解决

方式一：

终归还是编码的问题。主要起作用的是先 decode 再进行 encode 操作。

 def read_xls(io_path):
    sheet = pd.read_excel(io_path, encoding='utf8')
    print str(sheet.values[1]).decode("unicode_escape").encode("utf8")

参考原因：为什么是这样？控制器显示的字符是 UTF8 的，所以最后需要 encode 成UTF8的，2.为什么要用 decode ? 因为要 encode成UTF8 ，得是 unicode 格式的字符串才行，但是默认的字符串是 str 型的，所有需要把其他的字符编码转成 UNICODE 才行，然后，因为打印出来的乱码是 . u'\XXX' 这种形式，所以根据经验应该是 unicode_escape 形式。

方式二

方式一有点逃避问题，额，经过反复试验，方式二更加靠谱。

 def read_xls(io_path):
	# sheet是DataFrame格式，相当于整个表
    sheet = pd.read_excel(io_path, encoding='utf-8')
    # 此处提取的sheet.values是一个数组，其中的item也是一个数组。
    # sheet.values就像sheet中的所有数据
    # 因此item就相当于一行，那么一行肯定也是一个数组，因为包含多个列
    for item in sheet.values:
        item_con = item[0]
        print item_con

参考链接

1，python处理中文excel问题

查看更多关于pandas读取excel出现乱码问题解决的详细内容...

声明：本文来自网络，不代表【好得很程序员自学网】立场，转载请注明出处：http://haodehen.cn/did125969

更新时间：2022-11-28 阅读：68次