No. | 質問・回答 | おれい |
|
[73630] CSVファイルの特定項目の計算(集計)をしたい |
|
|
手元に、1.5GBのCSVファイルがあります。データ件数は3000万件ほどあるんですが、緊急で以下のことを行わなければなりません。
CSV項目の1番目と4番目と7番目の項目が同じデータについて
2番目と8番目の項目を集計する。
なお、データはソートされていません。
エクセルで開こうにも、うんともすんともいわなくなってしまい。途方にくれています。
ぶんぼうぐ 2005年12月7日19:34
|
|
|
|
[73636] |
>データ件数は3000万件ほどあるんですが
件数が多すぎます。
Excelは最大でも1シートあたり65536件件しか処理できません。
元ファイルを適当な件数で分割しないと、読み込むことが出来ないと思いますが。
まあ、VBAでプログラムを書く技術と根性があれば、適当な件数ごとに
処理を繰り返すコードは書けそうな気はします。
・・・手動で分割したほうが早く終わりそうな気もしますけど(苦笑)
mory (512) 2005年12月7日22:26
|
|
|
|
[73642] |
それをいっちゃあ、おしまいでしょ。
ぶんぼうぐ 2005年12月7日23:30
|
|
|
|
[73652] |
おしまい・・・たって、どうすることも出来ないですから。
件数上、どうやってもExcelには無理なんです。そもそもそれだけの
件数を処理する場合、普通ならOracleあたりの出番ですもの。
mory (512) 2005年12月8日10:23
|
|
|
|
[73654] |
ファイル加工用のユーティリティをつかえばいいじゃん。 http://hp.vector.co.jp/authors/VA015622/csvcmp.files /csvcmp.exe
>CSV項目の1番目と4番目と7番目の項目が同じデータについて
>2番目と8番目の項目を集計する。
C:\TEMP> CSVCMP INPUT.TXT OUTPUT.TXT (1)(4)(7)[2][8]
と実行する。
mono (10) 2005年12月8日11:13
|
+5 p
|
|
|
[73656] |
あ、CSVファイルのソートは、http://hp.vector.co.jp/authors/VA015622/sortcsv.files /SORTCSV.exe
C:\> SORTCSV INPUT.CSV OUTPUT.CSV (1)(4)(7) でできます。
mono (10) 2005年12月8日11:21
|
+5 p
|
|
|
[73657] |
いま、計算が完了しました。ホストの集計予想値と一致しました。すばらしいですね。(あるとこにはあるんだ)
質問を終了します。ありがとうございました。
ぶんぼうぐ 2005年12月8日11:57
|
|
|
|
( 参照数:1683 日平均:0.3 ) |
|
〜 回答の受付を終了しました 〜 |