python – pandas dataframe:如何计算二进制列中1行的数量?

前端之家收集整理的这篇文章主要介绍了python – pandas dataframe:如何计算二进制列中1行的数量?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有以下pandas DataFrame:
  1. import pandas as pd
  2. import numpy as np
  3.  
  4. df = pd.DataFrame({"first_column": [0,1,0]})
  5.  
  6. >>> df
  7. first_column
  8. 0 0
  9. 1 0
  10. 2 0
  11. 3 1
  12. 4 1
  13. 5 1
  14. 6 0
  15. 7 0
  16. 8 1
  17. 9 1
  18. 10 0
  19. 11 0
  20. 12 0
  21. 13 0
  22. 14 1
  23. 15 1
  24. 16 1
  25. 17 1
  26. 18 1
  27. 19 0
  28. 20 0

first_column是0和1的二进制列.存在连续的“簇”,它们总是成对出现至少两个.

我的目标是创建一个列“计算”每组的行数:

  1. >>> df
  2. first_column counts
  3. 0 0 0
  4. 1 0 0
  5. 2 0 0
  6. 3 1 3
  7. 4 1 3
  8. 5 1 3
  9. 6 0 0
  10. 7 0 0
  11. 8 1 2
  12. 9 1 2
  13. 10 0 0
  14. 11 0 0
  15. 12 0 0
  16. 13 0 0
  17. 14 1 5
  18. 15 1 5
  19. 16 1 5
  20. 17 1 5
  21. 18 1 5
  22. 19 0 0
  23. 20 0 0

这听起来像df.loc()的工作,例如df.loc [df.first_column == 1] ……某事

我只是不确定如何考虑每个“群集”,以及如何用“行数”标记每个独特的群集.

怎么会这样做?

解决方法

这是NumPy的 cumsumbincount的一种方法
  1. def cumsum_bincount(a):
  2. # Append 0 & look for a [0,1] pattern. Form a binned array based off 1s groups
  3. ids = a*(np.diff(np.r_[0,a])==1).cumsum()
  4.  
  5. # Get the bincount,index into the count with ids and finally mask out 0s
  6. return a*np.bincount(ids)[ids]

样品运行 –

  1. In [88]: df['counts'] = cumsum_bincount(df.first_column.values)
  2.  
  3. In [89]: df
  4. Out[89]:
  5. first_column counts
  6. 0 0 0
  7. 1 0 0
  8. 2 0 0
  9. 3 1 3
  10. 4 1 3
  11. 5 1 3
  12. 6 0 0
  13. 7 0 0
  14. 8 1 2
  15. 9 1 2
  16. 10 0 0
  17. 11 0 0
  18. 12 0 0
  19. 13 0 0
  20. 14 1 5
  21. 15 1 5
  22. 16 1 5
  23. 17 1 5
  24. 18 1 5
  25. 19 0 0
  26. 20 0 0

将前6个元素设置为1,然后测试 –

  1. In [101]: df.first_column.values[:5] = 1
  2.  
  3. In [102]: df['counts'] = cumsum_bincount(df.first_column.values)
  4.  
  5. In [103]: df
  6. Out[103]:
  7. first_column counts
  8. 0 1 6
  9. 1 1 6
  10. 2 1 6
  11. 3 1 6
  12. 4 1 6
  13. 5 1 6
  14. 6 0 0
  15. 7 0 0
  16. 8 1 2
  17. 9 1 2
  18. 10 0 0
  19. 11 0 0
  20. 12 0 0
  21. 13 0 0
  22. 14 1 5
  23. 15 1 5
  24. 16 1 5
  25. 17 1 5
  26. 18 1 5
  27. 19 0 0
  28. 20 0 0

猜你在找的Python相关文章