导读 在数据分析中,`pd.merge()` 是 Pandas 提供的一个强大工具,用于将两个 DataFrame 按照指定键进行合并。它类似于 SQL 中的 JOIN ...
在数据分析中,`pd.merge()` 是 Pandas 提供的一个强大工具,用于将两个 DataFrame 按照指定键进行合并。它类似于 SQL 中的 JOIN 操作,能够轻松实现复杂的数据整合任务。如果你刚接触这个函数,不妨跟着以下步骤快速上手!✨
首先,确保你已经导入了 Pandas:
```python
import pandas as pd
```
然后,创建两个示例 DataFrame:
```python
df1 = pd.DataFrame({'id': [1, 2, 3], 'name': ['Tom', 'Jerry', 'Spike']})
df2 = pd.DataFrame({'id': [1, 2, 4], 'score': [90, 85, 95]})
```
接下来,使用 `pd.merge()` 合并它们:
```python
merged_df = pd.merge(df1, df2, on='id')
```
默认情况下,`pd.merge()` 会执行内连接(inner join),即只保留两个表中共有的键值对。如果需要其他类型的连接方式,可以添加参数:
- left join:`how='left'`
- right join:`how='right'`
- outer join:`how='outer'`
💡 小提示:`on` 参数指明合并键,也可以通过 `left_on` 和 `right_on` 分别指定左右 DataFrame 的键名。
通过以上方法,你可以轻松完成数据合并任务!💪 熟悉了基础后,还可以尝试更复杂的多表联结或设置多个合并键。加油,数据分析小白也能成为高手!🚀