批处理文件 – 使用命令行将文本文件分割成较小的多个文本文件

前端之家收集整理的这篇文章主要介绍了批处理文件 – 使用命令行将文本文件分割成较小的多个文本文件前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有多个文本文件大约有10万行,我想把它们拆分成更小的文本文件,每行5000行。

我用了:

  1. split -l 5000 filename.txt

创建文件

  1. xaa
  2. xab
  3. aac
  4. xad
  5. xbe
  6. aaf

没有扩展名的文件我只想打电话给他们:

  1. file01.txt
  2. file02.txt
  3. file03.txt
  4. file04.txt

或者如果不可能,我只是希望他们拥有“.txt”扩展名。

解决方法

  1. @ECHO OFF
  2. SETLOCAL
  3. SET "sourcedir=U:\sourcedir"
  4. SET /a fcount=100
  5. SET /a llimit=5000
  6. SET /a lcount=%llimit%
  7. FOR /f "usebackqdelims=" %%a IN ("%sourcedir%\q25249516.txt") DO (
  8. CALL :select
  9. FOR /f "tokens=1*delims==" %%b IN ('set dfile') DO IF /i "%%b"=="dfile" >>"%%c" ECHO(%%a
  10. )
  11. GOTO :EOF
  12. :select
  13. SET /a lcount+=1
  14. IF %lcount% lss %llimit% GOTO :EOF
  15. SET /a lcount=0
  16. SET /a fcount+=1
  17. SET "dfile=%sourcedir%\file%fcount:~-2%.txt"
  18. GOTO :EOF

这是一个本机Windows批处理,应该完成任务。

现在我不会说它会很快(每个5Kline输出文件不到2分钟),或者它会免受批量字符敏感。真的取决于你的目标数据的特点。

我使用一个名为q25249516.txt的文件,其中包含100K线的数据用于我的测试。

修改更快版本

REM

  1. @ECHO OFF
  2. SETLOCAL
  3. SET "sourcedir=U:\sourcedir"
  4. SET /a fcount=199
  5. SET /a llimit=5000
  6. SET /a lcount=%llimit%
  7. FOR /f "usebackqdelims=" %%a IN ("%sourcedir%\q25249516.txt") DO (
  8. CALL :select
  9. >>"%sourcedir%\file$$.txt" ECHO(%%a
  10. )
  11. SET /a lcount=%llimit%
  12. :select
  13. SET /a lcount+=1
  14. IF %lcount% lss %llimit% GOTO :EOF
  15. SET /a lcount=0
  16. SET /a fcount+=1
  17. MOVE /y "%sourcedir%\file$$.txt" "%sourcedir%\file%fcount:~-2%.txt" >NUL 2>nul
  18. GOTO :EOF

请注意,我使用了50000的llimit进行测试。如果llimit * 100比文件中的行数更多,则会覆盖早期文件编号(通过将fcount设置为1999并在文件重命名行中使用〜3代替〜2来修复)。

猜你在找的HTML相关文章