基础
以下操作基于python 3.6 windows 10 环境下 通过
将通过实例来演示三者的区别
toward_dict = {1: '东', 2: '南', 3: '西', 4: '北'} df = pd.DataFrame({'house' : list('AABCEFG'), 'price' : [100, 90, '', 50, 120, 150, 200], 'toward' : ['1','1','2','3','','3','2']}) df
map()方法
通过df.(tab)键,发现df的属性列表中有apply() 和 applymap(),但没有map().
map()是python 自带的方法, 可以对df某列内的元素进行操作, 我个人最常用的场景就是有toward_dict
的映射关系 ,为df中的toward
匹配出结果,
df['朝向'] = df.toward.map(toward_dict);df
结果就是没有匹配出来, why"htmlcode">
第一种思路:`toward_dict`的key转换为str型 toward_dict2 = dict((str(key), val) for key, val in toward_dict.items())
# 第二种思路, 将df.toward转为int型 df.toward = df.toward.map(lambda x: np.nan if x == '' else x).map(int,na_action='ignore') df['朝向2'] = df.toward.map(toward_dict);df
apply() 方法
更新时间: 2018-08-10
我目前的实际工作中使用apply()
方法比较少, 所以整理的内容比较简陋, 后续涉及到数据分析方面可能会应用比较多些.
先将上面的测试中的map
替换为apply
,看看怎么样"_blank" href="http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.apply.html" rel="external nofollow" >DataFrame.apply官方文档
文档中第一个参数:
func : function
Function to apply to each column or row.
意思即是, 将传入的func
应用到每一列或每一行,进行元素级别的运算
第二个参数:
axis : {0 or ‘index', 1 or ‘columns'}, default 0
Axis along which the function is applied:
0 or ‘index': apply function to each column. # 注意这里的解释
1 or ‘columns': apply function to each row.
举例:
这个要特别注意的,
没有继续使用map里的DF, 是因为df.house是字符串, 不能进行np.sum
运算,会报错.
2018年12月3日
新增:
最近在工作中使用到了pandas.apply()
方法,更新如下:
背景介绍:
一个 df
有三个列需要进行计算,change_type
值 为1和0, 1为涨价,0为降价, price
为现价, changed
为涨降价的绝对值, 现求:涨降价的比例, 精确到0位,无小数位,
解决思路:
1.最主要的计算是: 涨降价的绝对值/ 原价
2.最主要的难点是: 涨价的原价 = 现价 - 绝对值
降价的原价 = 现价 + 绝对值
伪代码如下: 涨降价比例 = round(changed/(price 加上或减去 changed), 0)
就是我需求的结果了.
解决方案 如下:
以下代码经过win 10 环境 python3.6 版本测试通过
import pandas as pd df = pd.DataFrame({'change_type' : [1,1,0,0,1,0], 'price' : [100, 90, 50, 120, 150, 200], 'changed' : [10,8,4,11,14,10]}) def get_round(change_type, price, changed_val): """ 策略设计 """ if change_type == 0: return round(changed_val/(price + changed_val) * 100, 2) elif change_type == 1: return round(changed_val/(price - changed_val) * 100, 2) else: print(f'{change} is not exists') # 策略实现 df['round'] = df.apply(lambda x: get_round(x['change_type'], x['price'], x['changed']),axis=1)
若有问题, 欢迎指正, 谢谢
applymap()
参考DataFrame.applymap官方文档:
func : callable
Python function, returns a single value from a single value.
文档很简单, 只有一个参数, 即传入的func
方法
样例参考文档吧, 没有比这个更简单了
总结:
map() 方法是pandas.series.map()方法, 对DF中的元素级别的操作, 可以对df的某列或某多列, 可以参考文档
apply(func) 是DF的属性, 对DF中的行数据或列数据应用func
操作.
applymap(func) 也是DF的属性, 对整个DF所有元素应用func
操作
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新日志
- 小骆驼-《草原狼2(蓝光CD)》[原抓WAV+CUE]
- 群星《欢迎来到我身边 电影原声专辑》[320K/MP3][105.02MB]
- 群星《欢迎来到我身边 电影原声专辑》[FLAC/分轨][480.9MB]
- 雷婷《梦里蓝天HQⅡ》 2023头版限量编号低速原抓[WAV+CUE][463M]
- 群星《2024好听新歌42》AI调整音效【WAV分轨】
- 王思雨-《思念陪着鸿雁飞》WAV
- 王思雨《喜马拉雅HQ》头版限量编号[WAV+CUE]
- 李健《无时无刻》[WAV+CUE][590M]
- 陈奕迅《酝酿》[WAV分轨][502M]
- 卓依婷《化蝶》2CD[WAV+CUE][1.1G]
- 群星《吉他王(黑胶CD)》[WAV+CUE]
- 齐秦《穿乐(穿越)》[WAV+CUE]
- 发烧珍品《数位CD音响测试-动向效果(九)》【WAV+CUE】
- 邝美云《邝美云精装歌集》[DSF][1.6G]
- 吕方《爱一回伤一回》[WAV+CUE][454M]