pandas 将字符串映射为数字
在有些数据集中,有些数据变量用字符串表示,但为了方便处理,往往想转换为好处理的格式,这时候不一定要用one hot进行编码,也可以直接转成整数:
test_df["xx"] = pd.factorize(test_df["xx"])[0].astype(int)
但是这样映射的数字是从0开始的,如果有初始要求,可以对映射结果加上某个值,例如,把从0开始变为从15开始:
test_df["xx"] = test_df["xx"].add(15)
效果gift_cards["user_id"] = pd.factorize(gift_cards["user_id"])[0].astype(int):
pandas 将某一列的字符值转换为数字
使用map的方法就可以实现把某一列的字符类型的值转换为数字。
class_mapping = {'A':0, 'B':1} data[class] = data[class].map(class_mapping)首先定义一个字典,然后使用map方法就可以把某一列的字符类型的值转换为数字。
好了,这就是对使用pandas把某一列的字符值转换为数字的认识。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。
查看更多关于pandas 如何将字符串映射为数字的详细内容...
声明:本文来自网络,不代表【好得很程序员自学网】立场,转载请注明出处:http://haodehen.cn/did15876