频道导航

Python – 转换数据帧和切片

2019-05-14 Python 前端之家

前端之家收集整理的这篇文章主要介绍了Python – 转换数据帧和切片，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我附上了截图以帮助解释.我有一个从克利夫兰心脏数据集中提取的数据框,该数据集占用76列并将它们放入7列,并将其他列包装到下一行.我试图弄清楚如何将该数据帧变为可读格式,如右侧的数据框所示.

变量xyz将始终相同,但我列出的其他字母变量将不同.我以为我可以使用data.loc [：,：’xyz’]开始,但我不知道从哪里开始：

data = pd.read_csv("../resources/cleveland.data")
data.loc[:,:'xyz']

然后我必须从那里开始为这些变量分配列名.令人惊讶的是,一旦我解决了这个问题,火车,测试,验证部分将更加容易.在此先感谢您的帮助. (我是菜鸟)

最佳答案

输入数据

1   a   b   c
d   xyz 2   e
f   g   h   xyz
3   i   j   k

码

import pandas as pd
import numpy as np

# The initial data doesn't contain header so set header to None
df = pd.read_csv("../resources/cleveland.data",header=None)
cols = df.columns.tolist()

# Reset the index to get the line number in the durty file
df = df.reset_index()

# After having melt the df,you can filter the df in order to have every values in one column.
# Those values are in the right order
df = pd.melt(df,id_vars=['index'],value_vars=cols)
df = df.sort_values(by=['index','variable'])

# Then you can set the line number
df['line'] = np.where(df.value == 'xyz',1,np.nan)
df.line = df.line.cumsum()
df.line = df.line.bfill()

# If the file doesn't end with 'xyz',we have to set the line number to df.line.max() + 1
df.loc[df.line.isna(),'line'] = df.line.max() + 1
df.line = df.line.ffill()

# We can set the column names as interger with a groupby cumsum
df['one'] = 1
df['col_name'] = df.groupby(['line'])['one'].cumsum()
df['col_name'] = "col_" + df['col_name'].astype('str')

# Then we can pivot the table
df = df[['value','line','col_name']]
df = df.pivot(index='line',columns='col_name',values='value')
print(df)

输出数据

col_name col_1 col_2 col_3 col_4 col_5 col_6
line
1.0          1     a     b     c     d   xyz
2.0          2     e     f     g     h   xyz
3.0          3     i     j     k   NaN   NaN

上一篇：python – 将列从一个数据框映射到下一篇：python – 无法使用sort_contors构

猜你在找的Python相关文章

爬虫实战：探索XPath爬虫技巧之热榜新闻

在这篇文章中，我们深入学习了XPath作为一种常见的网络爬虫技巧。XPath是一种用于定位和选...

作者：努力的小雨时间：2024-09-28

谁说后端不能画出美丽的动图？让我来给大家拜个年！

祝福大家龙年快乐！愿你们的生活像龙一样充满力量和勇气，愿你们在新的一年里，追逐梦想，...

作者：努力的小雨时间：2024-09-28

爬虫实战：从网页到本地，如何轻松实现小说离线阅读

今天在爬虫实战中，除了正常爬取网页数据外，我们还添加了一个下载功能，主要任务是爬取小...

作者：努力的小雨时间：2024-09-28

爬虫实战+数据分析：全国消费支出分析及未来预测

完美收官，本文是爬虫实战的最后一章了，所以尽管本文着重呈现爬虫实战，但其中有一大部分...

作者：努力的小雨时间：2024-09-28

Java开发者的Python进修指南：JSON利器之官方json库、demjson和orjson的实用指南

JSON是一种流行的数据传输格式，Python中有多种处理JSON的方式。官方的json库是最常用的，...

作者：努力的小雨时间：2024-09-28

使用Python的turtle模块绘制美丽的樱花树

通过本文的学习和实践，我们掌握了使用Python的turtle模块来创作樱花树图画的技巧，这个过...

作者：努力的小雨时间：2024-09-28

利用大型语言模型轻松打造浪漫时刻

在这篇文章中，我们介绍了如何利用大型语言模型为情人节营造难忘的氛围。通过上传图片并进...

作者：努力的小雨时间：2024-09-28

成为一个合格程序员所必备的三种常见LeetCode排序算法

排序算法是一种通过特定的算法因式将一组或多组数据按照既定模式进行重新排序的方法。通过...

作者：努力的小雨时间：2024-09-28

5分钟上手Python爬虫：从干饭开始，轻松掌握技巧

本文的重点在于引导读者如何初步掌握爬虫技术。初步掌握爬虫技术并不难，但是在实际操作中...

作者：努力的小雨时间：2024-09-28

AI实用指南：5分钟搭建你自己的LLM聊天应用

本文介绍了如何快速搭建一个基于大型语言模型（LLM）的混元聊天应用。强调了开发速度的重要...

作者：努力的小雨时间：2024-09-28

编程分类

PHP Java Java SE Python C#C&C++Ruby VB asp.Net Go Perl netty Django Delphi Jsp .NET Core Spring Flask Springboot SpringMVC Lua Laravel Mybatis Asp Groovy ThinkPHP Yii swoole

最新文章