Перейти к содержимому













Фотография

Чистка данных


  • Авторизуйтесь для ответа в теме
Сообщений в теме: 11

#1 vitam1n

vitam1n
  • Premium
  • Сообщений: 208
  • Регистрация: 19.07.2014
  • Заработано: 0 руб.
Репутация: 77

Награды: 13

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 16:36

Возникла потребность в очищении списка данных в txt от мусора.

Имеется список данных в столбик.

Например, мы хотим избавиться от всех строк, в которых содержится хотя бы один символ, который нам не подходит. А подходят нам, например, только латинские буквы и цифры (или те символы, которые мы сами укажем). Все остальное нас не устраивает. Как очистить все строки, которые нам не нужны?

Хотелось бы понять, как это можно почистить через Notepad++

86ff0258c59ca6284f35f09220eef390.png

 

 


  • 0

#2 Kot9tko

Kot9tko

    Гарант Slivup.biz

  • Сливапер LVL 5
  • Сообщений: 1 025
  • Регистрация: 12.03.2014
  • Заработано: 5 руб.
Репутация: 431

Награды: 20

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 16:54

Попробуйте через найти/замена .


  • 0

#3 vitam1n

vitam1n
  • Premium
  • Сообщений: 208
  • Регистрация: 19.07.2014
  • Заработано: 0 руб.
Репутация: 77

Награды: 13

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 16:56

Попробуйте через найти/замена .


Это естественно. Но весь вопрос в том, ЧТО менять на ЧТО.


  • 0

#4 Kot9tko

Kot9tko

    Гарант Slivup.biz

  • Сливапер LVL 5
  • Сообщений: 1 025
  • Регистрация: 12.03.2014
  • Заработано: 5 руб.
Репутация: 431

Награды: 20

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 16:57

на пробел допустим.


  • 0

#5 vitam1n

vitam1n
  • Premium
  • Сообщений: 208
  • Регистрация: 19.07.2014
  • Заработано: 0 руб.
Репутация: 77

Награды: 13

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 17:02

на пробел допустим.

Если бы было все так просто  :) 

Дело в том, что мне нужно не удалить определенные символы, а оставить их. 

То есть оставить нужно только буквы латиницы и цифры, плюс тире и нижнее подчеркивание.

А все остальное (точки, запятые, восклицательные знаки, китайские иероглифы, пробелы, скобки и т.д.) нужно полностью удалить. 

И желательно полностью удалить все строки, где есть хоть один ненужный символ.


Сообщение отредактировал vitam1n: 03 Ноябрь 2014 - 17:06

  • 0

#6 agrx

agrx
  • Сливапер LVL 7
  • Сообщений: 1 516
  • Регистрация: 23.09.2014
  • Заработано: 212 руб.
Репутация: 1 223

Награды: 28

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 17:21

Если китай начинается первой буквой, то можно отсортировать по значению в экселе. Так же можно автоматизировать в самом нотпаде скрипт работы. Например: поиск китайщины - переход кликом на начало строки - шифт+кнопка вниз - делит. и на повтор. И кстати, заменять можно на пустоту, даже пробел не ставить.


Сообщение отредактировал agrx: 03 Ноябрь 2014 - 17:27

  • 2

#7 vitam1n

vitam1n
  • Premium
  • Сообщений: 208
  • Регистрация: 19.07.2014
  • Заработано: 0 руб.
Репутация: 77

Награды: 13

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 17:31

Если китай начинается первой буквой, то можно отсортировать по значению в экселе. Так же можно автоматизировать в самом нотпаде скрипт работы. Например: поиск китайщины - переход кликом на начало строки - шифт+кнопка вниз - делит. и на повтор. И кстати, заменять можно на пустоту, даже пробел не ставить.


А если помимо китайщины еще 200 языков? Должен все равно же выход быть. Но не находить ЛИШНЕЕ и менять его, а оставить только НУЖНОЕ.


  • 0

#8 agrx

agrx
  • Сливапер LVL 7
  • Сообщений: 1 516
  • Регистрация: 23.09.2014
  • Заработано: 212 руб.
Репутация: 1 223

Награды: 28

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 18:26

А если помимо китайщины еще 200 языков? Должен все равно же выход быть. Но не находить ЛИШНЕЕ и менять его, а оставить только НУЖНОЕ.

Ну, бесплатные очевидные методы я обозначил. Из платных 2 очевидных варианта: заказать программу по критериям или заказать сортировку исполнителю разовую.


  • 0

#9 Asin

Asin
  • Сливапер LVL 5
  • Сообщений: 131
  • Регистрация: 11.10.2013
  • Заработано: 3 руб.
Репутация: 190

Награды: 12

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 19:04

Скрытый контент:

  Для просмотра содержимого необходимо 1 очков репутации (вам не хватает 1)

 Скачать без ограничений   Купить этот материал за 390 руб.


Сообщение отредактировал Asin: 03 Ноябрь 2014 - 19:05

  • 1

#10 akir

akir
  • Модератор
  • Сообщений: 1 328
  • Регистрация: 04.05.2014
  • Заработано: 104 руб.
Репутация: 755

Награды: 27

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 19:35

А если помимо китайщины еще 200 языков? Должен все равно же выход быть. Но не находить ЛИШНЕЕ и менять его, а оставить только НУЖНОЕ.

 

Погугли программы, которые способны работать с регулярными выражениями, составь такое выражение под то, что тебе нужно. Отфильтруй.


  • 0

#11 vitam1n

vitam1n
  • Premium
  • Сообщений: 208
  • Регистрация: 19.07.2014
  • Заработано: 0 руб.
Репутация: 77

Награды: 13

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 19:40

Спасибо, буду разбираться.



Погугли программы, которые способны работать с регулярными выражениями, составь такое выражение под то, что тебе нужно. Отфильтруй.

Придется разбираться с регулярными выражениями :)


  • 0

#12 romankkk

romankkk
  • Platinum
  • Сообщений: 73
  • Регистрация: 21.06.2014
  • Заработано: 0 руб.
Репутация: 30

Награды: 15

  
  
  
  
  
  
  
  

Отправлено 03 Ноябрь 2014 - 20:11

это задача для GREP


  • 0



Похожие темы Collapse

Количество пользователей, читающих эту тему: 0

0 пользователей, 0 гостей, 0 анонимных

×

Зарегистрируйся моментально!