全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1943|回复: 24
打印 上一主题 下一主题

几百万行txt有啥简单的办法去重吗?

[复制链接]
跳转到指定楼层
1#
发表于 2021-7-24 12:21:58 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
notepad++的去重插件貌似没了,正则表达的话感觉不效率啊
推荐
发表于 2021-7-24 12:48:57 来自手机 | 只看该作者
cat xxxx.txt | sort | uniq
推荐
发表于 2021-7-24 21:50:28 | 只看该作者
windows用powershell
  1. Get-Content .\t.txt | sort -Unique > result.txt
复制代码

试试
25#
 楼主| 发表于 2021-7-24 22:52:17 | 只看该作者
海苔 发表于 2021-7-24 21:50
windows用powershell

试试

牛逼啊,大哥
23#
发表于 2021-7-24 21:39:02 来自手机 | 只看该作者
采集大佬么
22#
发表于 2021-7-24 17:52:16 | 只看该作者
写个shell脚本
21#
发表于 2021-7-24 17:46:13 | 只看该作者
佳辉的春天 发表于 2021-7-24 15:48
不知道为什么...在windows下安装linux后,测试失败

win7试试mingw或cygwin,如果win10就WSL
20#
发表于 2021-7-24 17:06:44 | 只看该作者
UltraEdit 听说过没?
19#
发表于 2021-7-24 16:54:48 | 只看该作者
emeditor,几千万都没问题
18#
发表于 2021-7-24 16:31:24 | 只看该作者
excel格式重复值 就是你这数据量太大 excel会不会无响应
17#
 楼主| 发表于 2021-7-24 15:48:27 | 只看该作者
mean 发表于 2021-7-24 12:48
cat xxxx.txt | sort | uniq

不知道为什么...在windows下安装linux后,测试失败
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-12-20 12:49 , Processed in 0.091626 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表