Команда Linux, чтобы удалить дубликаты строк, но сохранить первое вхождение

Question

Команда Linux, чтобы удалить дубликаты строк, но сохранить первое вхождение

729

user9371654 2018-06-05 в 09:53

У меня есть текстовый файл. Каждая строка содержит строку. Некоторые строки повторяются. Я хочу удалить повтор, но я хочу сохранить первое вхождение. Например:

line1 line1 line2 line3 line4 line3 line5

Должно быть

line1 line2 line3 line4 line5

Я пытался: sort file1 | uniq -u > file2но это не помогло. Он удалил все повторяющиеся строки, пока я хочу, чтобы присутствовало первое вхождение. Мне не нужно сортировать. Просто удалите точное повторение строки в новой строке, оставив все как есть.

1

2 ответа на вопрос

2

0

agc 2018-06-06 в 09:19

Специализированные утилиты, которые печатают уникальные строки без сортировки:

uq,
unique,

Смотрите также: Как получить только уникальные результаты без сортировки данных? и Unix: удаление повторяющихся строк без сортировки .

Accepted Answer · 2018-06-05 10:17:05

Если вы разрешите сортировку в любом случае, это будет работать:

sort | uniq

-uбыл источником вашей проблемы, потому что (от man 1 uniq):

-u, --unique
печатать только уникальные строки

пока по умолчанию:

Без опций совпадающие строки объединяются с первым вхождением.

Команда Linux, чтобы удалить дубликаты строк, но сохранить первое вхождение

2 ответа на вопрос

Похожие вопросы