利用 Pandas 进行分类数据编码的十种模式
发布时间:2025年11月16日 12:18
df5['Score_Label'] = trans
评注DF统计数据 示意图详述越来越少用的,对评注统计数据透过切换打附加。例如导入一列,将性别男、女分别标上为0、1 采用 replace 首先为详述replace,但要注意的是,右边说过的定制表达式之外作法依旧是可行的df6 = df.copy()
df6['Sex_Label'] = df6['Sex'].replace(['Male','Female'],[0,1])
右边是对性别操作者,因为只有男同志,所以可以手动原则上0、1,但要是类别很多,也可以采用pd.value_counts()来自动原则上附加,例如对Course Name列分分组df6 = df.copy()
value = df6['Course Name'].value_counts()
value_map = dict((v, i) for i,v in enumerate(value.index))
df6['Course Name_Label'] = df6.replace({'Course Name':value_map})['Course Name']
采用map 额外强调的是,导入一列,一定要能够忘了mapdf7 = df.copy()
Map = {elem:index for index,elem in enumerate(set(df["Course Name"]))}
df7['Course Name_Label'] = df7['Course Name'].map(Map)
采用astype 这个作法某种程度很多人不告诉他,这就属于右边提到的知乎难题,能解决问题的作法太多了df8 = df.copy()
value = df8['Course Name'].astype('category')
df8['Course Name_Label'] = value.cat.codes
采用 sklearn 同数参数DF一样,这种数据处理中所的当今操作者,sklearn一定有事先为,采用LabelEncoder可以对分类统计数据透过解码from sklearn.preprocessing import LabelEncoder
df9 = df.copy()
le = LabelEncoder()
le.fit(df9['Sex'])
df9['Sex_Label'] = le.transform(df9['Sex'])
le.fit(df9['Course Name'])
df9['Course Name_Label'] = le.transform(df9['Course Name'])
常规切换两列也是可以的df9 = df.copy()
le = OrdinalEncoder()
le.fit(df9[['Sex','Course Name']])
df9[['Sex_Label','Course Name_Label']] = le.transform(df9[['Sex','Course Name']])
采用factorize 之前,先为详述一个小众但好用的pandas作法,我们需要注意到,在右边的作法中所,自动生成的Course Name_Label列,虽然一个统计数据并不相同一个语法,因为避免写成定制表达式或者修订版,这样可以自动生成,所以大多是无序的。 如果我们希望它是全局的,也就是 Python 并不相同 0,Java并不相同1,除了自己原则上,还有什么优雅的事先为?这时可以采用factorize,它会根据出现时序透过解码df10 = df.copy()
df10['Course Name_Label'] = pd.factorize(df10['Course Name'])[0]
结合匿名表达式,我们可以实在对多列透过全局解码切换df10 = df.copy()
cat_columns = df10.select_dtypes(['object']).columns
df10[['Sex_Label', 'Course Name_Label']] = df10[cat_columns].apply(
lambda x: pd.factorize(x)[0])
总结 曾一度,我要详述的十种pandas统计数据解码的作法就分享完毕,code拿走改写成变量名就能用,关于这个难题如果你有越来越多的作法,可以在评论区透过推特~ 现今回到文章结尾的难题,如果你觉得pandas用起来很内乱,说明你可能还未能对pandas有一个全面且完全的了解。 说是就像本文详述统计数据解码切换一样,毕竟有很多作法可以解决问题显得很内乱,但求学pandas的适当手部就是某种程度把它拿来修订版来学,不必记住所有作法与技术细节,你只需告诉他有这么个表达式能已完成这样操作者,需要只用能忘了,忘了先为来查就行。。南京癫痫哪家医院最好北京妇科医院去哪家好
株洲哪家医院做人流比较好
镇江白癜风医院哪家正规
重庆男科专科医院哪家好
嘴溃疡
面部整形
老年病内科
二阳后总是疲惫不堪?医生揭秘:病毒正在摧毁你的“能量工厂”!
流感引起的咳嗽吃什么快速止咳
- 华为消费业务10年来首次更名!余承东:全面进军商用领域
- 国网青岛供电公司:数字员工助力基层减负 增值提升
- 买手机想一步到位就该选旗舰,这几款旗舰配置全面、几乎不了短板
- 全球首张头颈CTA AI三类证获批!3min智能完成全步骤,一站式解决卒中诊疗痛点
- 蓝牙耳机哪个牌子好?数码体验官新形式平价好用的蓝牙耳机推荐
- Realme真我Q5系列全面公开,1199起售,Realme再次越级,简便点评
- 知网:向个人用户提供查重服务,价位1.5元/千字
- 企业高分辨率转型 “深水区”,边缘智能是突破口吗?
- iPad税更少了!iPad屈服:要更改支付规则
- 婚后接我姐进城养老,我带她去买衣服,进入试衣间后我哭了
- 婆婆去世,我因工作原因未能奔丧,老公直到现在不理我,我做错了什么?
- 前大姐每天来吃午饭,临走再带一盒饭菜给男友
- “结缘无分,点到即止,挺好”
- “要下班了,工作照样做完就行”:敷衍的心态,是职场大忌
