假设您的DataFrame的列包含表达式(请参阅其他列),是否可以评估该列中包含的表达式?
我知道可以使用pd.eval()和df.eval()进行按列操作(如下所示).示例取自:
https://jakevdp.github.io/PythonDataScienceHandbook/03.12-performance-eval-and-query.html
假设您有:
import pandas as pd
df = pd.DataFrame([[1,2],[2,3],[5,6]],columns=['A','B'])
然后您可以编写:
df.eval('(A + B)')
您将获得一个包含3、5、11(预期)的系列.
现在,如果该表达式实际上在行与行之间变化并且实际上存储为列,该怎么办?例如此数据框:
df = pd.DataFrame([[1,2,"A + B"],3,"A - B"],6,"A + 2 * B"]],'B','C'])
如何评估C列中的表达式?
在这种情况下,预期结果是一个包含3,-1、17的序列.
谢谢你的帮助.
最佳答案
采用
>>> np.diag(df.C.apply(df.eval).values)
array([ 3,-1,17])
即使这是一个糟糕的IMO设计,由于您是I)对字符串中的操作进行硬编码,因此在需要时很难对其进行操作; II)将这些操作作为字符串存储在pandas DataFrame中,这对于许多字符串来说很慢涉及的操作.