Импорт данных из CSV с запятыми в скобках и скобками в полях

452
Corey

проблема

Я пытаюсь импортировать данные из CSV в Excel, но данные включают запятые в отдельных полях. Запятые, которые я хочу игнорировать, содержатся в скобках и скобках. Я хотел бы найти способ правильно импортировать эти данные, вместо того чтобы вручную просматривать и редактировать все «проблемные поля» . Некоторые из них могут быть еще более сложными из-за оригинальной японской кодировки файлов, которую я должен адаптировать для правильного просмотра. Не уверен, что это может способствовать проблеме, но я подумал, что важно упомянуть.

Примеры

Верхняя строка копируется напрямую из исходного файла с проблемами кодирования. Средняя линия происходит от надеюсь, правильно кодированного файла фиксированных текстовым. Нижняя строка из полученного файла CSV.

" 2010009" 9623 ・・・・・・・P・・・ユ ・E・`・m ・・・t・s・ヤ・ゥ・・・・・F・゚・J・ャ147-1・シ ・・・カ(・・・・ ・・・・ ・モ・・) ・テ・・(・テ・ュ[・O・・ ・・・・ ・・・・]) ・W・・・ユ ・テ・ュ ・L・ヒ ・ヘ・ン・i・u・・ ・・・n ・・・シ・n・E・サ・フ・シ ・R・ム ・ィ・n ・ュ・・(・テ・ュ[・・・ュ]) ・Z・・・E・・・ィ(・Z・・・ユ) ・y・B ・ヒ(・L・ヒ・E・L・w[・L・w]) ・Z・・・E・・・ィ(・・[・ラ・・<・ラ・オ・・>])・E・y・・・゙(・・・カ・y・・[・チ・]・・<B E・V E・W> ・タ・s<1 2 3a> ・W・R<2 3> ・フ・シ・・ ・x・V・・<1 2> ・O・Y] ・y・t・・) ・y・サ・i(・y・・ ・L・E・~・ツ ・y・ナ ・ョ・ィ・`・y・サ・i ・~・j・`・・・A・y・・) ・ホ・・(・・・ホ ・ネ・ホ ・・・ホ ・ホ・_ ・ホ・・ ・ニ・リ・ホ) ・ホ・サ・i(・ホ・ ・ホ・M ・ホ・V ・ホ・サ・・・ナ) ・エH1・`8、・カ199.205.218.230.237.258.269 H1・`8・N・イ・ク  2010009,9623,内野第1遺跡,ウチノ,千葉市花見川区宇那谷町147-1他,縄文(中期,後期,晩期),古代(古墳[前期,中期,後期]),集落跡, 古墳, 貝塚,河岸段丘上, 低地, 低湿地・その他, 山林, 畑地,墳墓(古墳[方墳]),住居・建物(住居跡),土坑,塚(貝塚・貝層[貝層]),住居・建物(穴[陥穴<陥し穴>])・土器類(縄文土器[加曽利<B,EⅢ,EⅣ>,安行<1,2,3a>,姥山<2,3>,称名寺,堀之内<1,2>,前浦],土師器),土製品(土偶,有孔円板,土版,動物形土製品,ミニチュア土器),石器(磨石,敲石,凹石,石棒,石剣,独鈷石),石製品(石斧,石皿,石鏃,石製岩版),抄H1~8、文199.205.218.230.237.258.269,H1~8年調査  " 2010009" 9623 内野第1遺跡 ウチノ 千葉市花見川区宇那谷町147-1他 縄文(中期 後期 晩期) 古代(古墳[前期 中期 後期]) 集落跡 古墳 貝塚 河岸段丘上 低地 低湿地・その他 山林 畑地 墳墓(古墳[方墳]) 住居・建物(住居跡) 土坑 塚(貝塚・貝層[貝層]) 住居・建物(穴[陥穴<陥し穴>])・土器類(縄文土器[加曽利<B EⅢ EⅣ> 安行<1 2 3a> 姥山<2 3> 称名寺 堀之内<1 2> 前浦] 土師器) 土製品(土偶 有孔円板 土版 動物形土製品 ミニチュア土器) 石器(磨石 敲石 凹石 石棒 石剣 独鈷石) 石製品(石斧 石皿 石鏃 石製岩版) 抄H1~8、文199.205.218.230.237.258.269 H1~8年調査 

связанные с

Я нашел эти связанные темы, которые касались проблемы, они помогли, но не решили проблему.

Как заставить Excel импортировать файл CSV с запятыми в некоторых полях содержимого?

Импорт CSV в Excel с запятыми в полях в кавычках

Как установить кодировку символов при открытии Excel

Обновить

В посте «Как заставить Excel импортировать файл CSV с запятыми в некоторые поля содержимого?» проблема была из-за пробелов между запятыми между полями и следующей кавычкой и значением. В этом случае пробелы не являются проблемой, а заключаются в том, что запятые заключены в скобки и скобки. Есть ли способ специально нацеливать только запятые, которые присутствуют в скобках и скобках?

0
Вопросы, на которые вы ссылаетесь, задают тот же вопрос, что и вы. Тот факт, что ответ, который работает для вас, еще не был предоставлен (и вы не говорите, что сработало, а что нет и почему), не меняет того факта, что этот вопрос дублирует предыдущие. Это вызовет те же ответы, что и предыдущие вопросы. Чтобы это был другой вопрос, вам необходимо различать, как отличается требование и какая разница требуется в ответе. fixer1234 6 лет назад 0
Возможный дубликат [Как заставить Excel импортировать файл CSV с запятыми в некоторые поля содержимого?] (Https://superuser.com/questions/52157/how-do-i-get-excel-to-import -a-CSV-файл с-запятых-в-некоторые-оф-контент-поля) fixer1234 6 лет назад 3
Я обновил пост. Проблема, обсуждаемая в одной из предоставленных мной ссылок, аналогична моей проблеме, но я не думаю, что решение, приведенное в этой ссылке, будет работать в моей ситуации. Corey 6 лет назад 0
Ваш пример длинный и запутанный японским текстом. Рассмотрите возможность предоставления [mcve] (https://stackoverflow.com/help/mcve). Он может содержать несколько японских символов, если они влияют на проблему, но, пожалуйста, сделайте ее короткой. Кроме того, было бы здорово, если бы вы прямо сказали, каким должен быть желаемый результат, чтобы мы могли сравнить фактический результат с желаемым и точно знать, какие запятые вы хотите сохранить и почему. Kamil Maciorowski 6 лет назад 0
Я не заметил запятых в первой строке. Я предполагаю, что есть проблема кодировки символов, которая не отображает японские символы? У вас есть какой-то процесс, который производит 2-ю строку? Там я вижу различные запятые в строках, которые содержат скобки и скобки (но не спаренные и не совпадающие, поэтому их не просто идентифицировать). Он также содержит пробелы после запятых. Так что у него много проблем. Логическое место для исправления - это процесс, который создает среднюю линию (которую вы не описываете). (Продолжение) fixer1234 6 лет назад 0
Вам нужно заключать в кавычки строки, содержащие запятые и / или пробелы, и удалять, а не вставлять пробелы. Скобки и скобки, кажется, не следуют простому шаблону, поэтому автоматизация, которая будет запутанной. У вас есть пробелы, как проблема в первой ссылке, и основные проблемы являются общими для многих других сообщений. В вопросе недостаточно информации для разработки автоматизированного решения для вашего конкретного случая. fixer1234 6 лет назад 0
Для примеров первая строка - это когда файл открывается непосредственно в Excel. Чтобы решить эту проблему, я открыл файл в блокноте и сохранил его как текстовый файл. Вы правы в том, что есть несколько пробелов, с которыми нужно будет разобраться, хотя я не думаю, что это вызывает основную проблему, касающуюся создания дополнительных столбцов. Просматривая данные, выглядело не так, как будто бы было простое решение, но спрашивать не мешало. Я не хочу сейчас чинить тысячи строк вручную. Надеюсь, я смогу найти данные в более чистом формате. Спасибо за попытку, хотя :) Corey 6 лет назад 0

0 ответов на вопрос