Python数据框的合并(二) — concat函数

        在Python模块Pandas中,concat 函数是一个常用的函数,用于将多个pandas对象(如Series、DataFrame)沿着一条轴进行连接,下面是对Pandas concat 函数的详细解释以及代码示例。

Pandas concat函数详解

concat 函数的基本语法如下:

pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False)

参数解释:

  • objs: 需要连接的pandas对象(Series或DataFrame)的序列或映射;
  • axis: 连接的轴,默认为0,即按行连接;如果为1,则按列连接;
  • join: 连接方式,默认为'outer',表示外连接;'inner'表示内连接;
  • ignore_index: 是否重置索引,默认为False;
  • keys: 可选参数,用于在连接时添加层次化索引中的键;
  • levels: 用于构建多层索引的参数;
  • names: 用于结果中索引的名称;
  • verify_integrity: 检查是否有重复项,默认为False;
  • sort: 对列标签进行排序,默认为False。
  • 代码示例

    示例1:按行连接两个DataFrame

    import pandas as pd 
    
    # 创建两个DataFrame 
    df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 
    'B': ['B0', 'B1', 'B2', 'B3'], 
    'C': ['C0', 'C1', 'C2', 'C3'], 
    'D': ['D0', 'D1', 'D2', 'D3']}, 
    index=[0, 1, 2, 3]) 
    
    df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 
    'B': ['B4', 'B5', 'B6', 'B7'], 
    'C': ['C4', 'C5', 'C6', 'C7'], 
    'D': ['D4', 'D5', 'D6', 'D7']}, 
    index=[4, 5, 6, 7]) 
    
    # 使用concat函数按行连接两个DataFrame 
    result = pd.concat([df1, df2]) 
    print(result)

    示例2:按列连接两个DataFrame

    # 假设我们有两个具有相同索引的DataFrame
    df3 = pd.DataFrame({'E': ['E0', 'E1', 'E2', 'E3'],
    'F': ['F0', 'F1', 'F2', 'F3']},
    index=[0, 1, 2, 3])
    
    # 使用concat函数按列连接两个DataFrame
    result_col = pd.concat([df1, df3], axis=1)
    print(result_col)

    示例3:使用keys参数

    # 使用keys参数添加层次化索引
    result_keys = pd.concat([df1, df2], keys=['df1', 'df2'])
    print(result_keys)

    注意事项

  • 当连接DataFrame时,如果列名不完全相同,则结果DataFrame将包含所有唯一的列名,并且缺失的列将填充为NaN。
  • 如果在连接时遇到索引冲突(例如,两个DataFrame具有相同的索引),则可以通过设置ignore_index=True来重置索引。
  • 使用keys参数时,结果DataFrame将具有一个额外的索引级别,该级别由keys参数中的值组成。
  • 作者:wodertianna

    物联沃分享整理
    物联沃-IOTWORD物联网 » Python数据框的合并(二) — concat函数

    发表回复