Pandas 合并多个Dataframe(merge,concat)的方法

站长资源 2026/8/1 佚名

40 1538 40

DDR爱好者之家 Design By 杰米

在数据处理的时候，尤其在搞大数据竞赛的时候经常会遇到一个问题就是，多个表单的合并问题，比如一个表单有user_id和age这两个字段，另一个表单有user_id和sex这两个字段，要把这两个表合并成只有user_id、age、sex三个字段的表怎么办的，普通的拼接是做不到的，因为user_id每一行之间不是对应的，像拼积木似的横向拼接肯定是不行的。

pandas中有个merge函数可以做到这个实用的功能，merge这个词会点SQL语言的应该都不陌生。

下面说说merge函数怎么用：

df = pd.merge(df1, df2, how='left', on='user_id')

用法很简单，说一下后两个参数就可以了，how=""参数表示以哪个表的key为准，上面的how="left"表示以表df1为准，而key也就是on=""的参数

how="left"就是说，保留user_id字段的全部信息，不增加也不减少，但是拼接的时候只把df2表中的与df1中user_id字段交集的部分合并上就可以了，如果df2中出现了某个user_id在df1中没有出现，就抛弃掉这个样本不作处理。

如果要进行多key合并：

df = pd.merge(df1, df2, how='left', on=['user_id','sku_id'])

但是如果想仅进行简单的“拼接”而不是合并呢，要使用concat函数：

df = pd.concat( [df_user, dummies_sex, dummies_age, dummies_level], axis=1 )

这样可以保留这些表单的全部信息，参数axis=1表示列拼接，axis=0表示行拼接。

要保证背个表单的行数是相同的，并且每一行对应的key也是相同的，列拼接才变得有意义

以上这篇Pandas 合并多个Dataframe(merge,concat)的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

Pandas,Dataframe,merge,concat

DDR爱好者之家 Design By 杰米

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

DDR爱好者之家 Design By 杰米

评论“Pandas 合并多个Dataframe(merge,concat)的方法”

暂无评论...

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。

首次推出的GDDR7内存模块密度为16GB，每个模块容量为2GB。其速度预设为32 Gbps（PAM3），但也可以降至28 Gbps，以提高产量和初始阶段的整体性能和成本效益。
据三星表示，GDDR7内存的能效将提高20%，同时工作电压仅为1.1V，低于标准的1.2V。通过采用更新的封装材料和优化的电路设计，使得在高速运行时的发热量降低，GDDR7的热阻比GDDR6降低了70%。

更新日志

2026年08月01日

Pandas 合并多个Dataframe(merge,concat)的方法

Python利用Django如何写restful api接口详解

使用pandas对两个dataframe进行join的实例

评论“Pandas 合并多个Dataframe(merge,concat)的方法”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

Pandas 合并多个Dataframe(merge,concat)的方法

Python利用Django如何写restful api接口详解

使用pandas对两个dataframe进行join的实例

评论“Pandas 合并多个Dataframe(merge,concat)的方法”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存