5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

Data Mining (データマイニング) part 1

1 :名無しさん@3周年:04/11/24 20:47:23


ちょっくら語ってみろや



2 :名無しさん@3周年:04/11/24 21:03:16
おい、誰か2 ゲットしろよ!

3 :名無しさん@3周年:04/11/25 01:07:37
誰も書き込みしてくれないなんて。。。
             /ヽ       /ヽ
            / ヽ      / ヽ
  ______ /U ヽ___/   ヽ
  | ____ /   U    :::::::::::U:\
  | |?/// /Vヽ // ___   \  ::::::::::::::|  何このスレ…?
  | |?ll l lノノノ))〉|  |   |     U :::::::::::::|
  | |ヽl ´∀`ノ|||U |   |      ::::::U::::|
  | ||/ヽ!トv^ リ?| ├―-┤ U.....:::::::::::::::::::/
  | |____ ヽ     .....:::::::::::::::::::::::<
  └___/ ̄ ̄      :::::::::::::::::::::::::|
  |\?   |           :::::::::::::::::::::::|
  ?\ \?  \___     ?::::::::::::::::::::::::|


4 :名無しさん@3周年:04/12/20 01:09:12
あげ

5 :名無しさん@3周年:04/12/20 19:37:39
「part 1」の文字が寂しく輝いてますね。

6 :名無しさん@3周年:04/12/24 01:50:04
21世紀はデータマイニングの時代だ。
とかは思わないので、地味に重回帰分析と多変量解析の勉強だけします。

7 :名無しさん@3周年:05/01/12 20:42:35
http://japanese.chosun.com/site/data/html_dir/2005/01/12/20050112000001.html

米紙「韓国テレビスターが日本の寄付文化を変えた」

8 :名無しさん@3周年:05/01/15 13:58:26
実務の世界でデータマイニングとはただの集計技術を言います。
クロス表でいっぱいいっぱいです。馬鹿ばっかりですから。

9 :名無しさん@3周年:05/01/30 03:42:29
変数選択の極意とは?教えてくれや

10 :べべ:05/02/01 00:45:56
やっぱニューロだろ。

貧乏人は、重回帰と赤池AICの組合せでがまんしな。
数学音痴の文系はSOMがいいかな。

11 :名無しさん@3周年:05/02/02 22:49:11
>>10
だってさ、レコードが100万くらいで、フィールドがさぁ、7千くらいかな。
ニューロなんかしたら、、、いつ終わるか、、。5千くらいでランダムで拾ってもさ、
意味があるのかなぁ。ふあんだぁ。

12 :名無しさん@3周年:05/02/04 23:52:13
決定木のboostingが最強!
>>10 “赤池AIC”じゃ“頭痛が痛い”にならないか?

13 :名無しさん@3周年:05/02/15 23:26:52
盛り上がってないな!

14 :名無しさん@3周年:05/02/17 02:58:39
データマイニングが研究できる大学で有名なところってどこですか?

15 :名無しさん@3周年:05/02/17 20:22:04
カーネギーメロン、ペンシルバニア大学とかだよ。でもさ、商業系のデータマイニングと
機械系とか分野がわかれるよ。

16 :名無しさん@3周年:05/02/18 00:42:18
すみません。今高校2年なのですが、本を読んでデータマイングに興味を
持ちました。商売に使う印象を受けたのですが、日本の大学で研究しているところはありますか。


17 :ぼるじょあ ◆yBEncckFOU :05/02/20 08:58:36
                                         
     ∧_∧  ∧_∧                             
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕                             
  = ◎――――――◎                      山崎渉&ぼるじょあ
                                          

18 :名無しさん@3周年:05/02/20 19:53:26
>>16
学ぶより、WEKAで遊べ!
これが使いこなせれば、様々な応用分野における分析者として一人前になれるはず
その気になればJAVAのソースを読む事だってできるから、下手な講義を聴講するより
身につくはず
もしも、上記を試し学者としてデータサイエンス理論や分析手法を極める気があるなら、
最低でも博士過程(xx先端技術大とか統数研(?)あたり)に進む必要がある。
学問としては未だ二流扱いなので、やはりKDDで論文発表をするのが王道だ

19 :山.崎 渉:05/02/22 19:16:51
...これからも僕を応援して下さいね(^^)。   
  
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
         
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。                         
  =〔~∪ ̄ ̄〕                                            
  = ◎――◎                      山崎渉                       
                                
 __∧_∧_                                                 
 |(  ^^ )| <寝るぽ(^^)      
 |\⌒⌒⌒\                                
 \ |⌒⌒⌒~|         山崎渉             
   ~ ̄ ̄ ̄ ̄                            
                            
   ∧_∧                                       
  (  ^^ )< ぬるぽ(^^)      
                                                       
    (⌒V⌒)                    
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。   
  ⊂|    |つ                                
   (_)(_)                      山崎パン 
                                         
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕                          
  = ◎――――――◎                      山崎渉&ぼるじょあ

20 :名無しさん@3周年:05/02/26 21:22:17
WEKAは確かによいソフトだし、アメリカでソースの説明が本ででてますな。

21 :名無しさん@3周年:2005/05/04(水) 21:24:47
話題求む

22 :名無しさん@3周年:2005/05/04(水) 21:30:26
WEKAが良いソフトぉ?
教育用の駄作としか思えない。
そもそもDMでJavaはきっついな。

23 :名無しさん@3周年:2005/05/10(火) 21:06:13
wekaの日本語の説明書ない?

24 :名無しさん@3周年:2005/05/15(日) 23:34:57
研究でデータマイニングをやりたいと思っています。
今考えているのはマルチメディア・マイニングです。
その中でも動画を扱って何かしらのマイニングをしたいと思っています。
なんかいいネタないですかね?
動画にこだわらなくてもいいんで、こうゆうことをデータマイニングしたら
面白いとか、そんなのがあったら教えていただきたいです。

25 :名無しさん@3周年:2005/05/21(土) 14:25:16
WEKAとTanagraぐらいかな、フリーで使えるのは。
てか、WEKA日本語化してくれ・・・

26 :名無しさん@3周年:2005/05/28(土) 13:05:06
wekaって決定木以外にどの手法があるの?

27 :名無しさん@3周年:2005/06/01(水) 14:09:31
sasとspssはどう違うの?

28 :名無しさん@3周年:2005/06/11(土) 14:33:45
>>25
MUSASHI

29 :名無しさん@3周年:2005/06/11(土) 14:53:24
MUSASHIはただのデータクレンジングソフトでしょ。
分析なんてできね

30 :べべ:2005/06/12(日) 09:56:47
>>26
決定木以外で使えそうなclassifierは

SOMreg
     サポートベクターマシンを重回帰ライクに変身させたもの。
     多重共線性にめっちゃ強い重回帰って思い込めばいい。

LinearRegression
     重回帰分析だけれど二つ機能が強化されている。
     1.赤池AICを使って意味の無い項を自動的に消してくれる。
     2.リッジ回帰 ・・・ 多重共線性を回避するためのくふう。


31 :名無しさん@3周年:2005/06/12(日) 10:56:58
予測に専念するならマルチコなんて気にすることないし、
同じく、予測に専念するなら意味のない項を消す必要もない。
リッジ回帰もなんかあれだし。

wekaは決定木だけだね。

32 :べべ:2005/06/14(火) 02:18:10
>>31
マルチコが重要では無い分野もあるんですね。
この話を棚上げすれば、「WEKAは決定木」だけ
といわれるとほぼ否定はできない。

そうすると使えるのは、J48とDecisionStumpく
らいかな。

グラフ機能も気に入ってますが。
でもバグが。


33 :名無しさん@3周年:2005/06/14(火) 21:47:43
> マルチコが重要では無い分野もあるんですね。

狭義のデータマイニングではマルチコなんて一切問題にしないと思うんだけど?


34 :名無しさん@3周年:2005/06/15(水) 04:25:47
ニューラルネットはどうよ
但しオプションメニュでGUIを有効にしてから動かしてくれよ



35 :名無しさん@3周年:2005/06/15(水) 22:28:40
wekaのNNは何層でも可能?

36 :名無しさん@3周年:2005/06/16(木) 23:46:40
>>35
Hidden Layerの追加・削除はマウス操作でできる
ちなみに自動設定ではデフォルトで、
(入力変数の数+出力のカテゴリ数)÷2 の数の
1層のHidden Layerになる (Hidden Layerがaの場合)
入力変数の数+出力のカテゴリ数 のHidden Layerにしたければ、
Hidden Layer設定にbを指定する
Hidden Layer設定に0を入れた場合は、Hidden Layer無しになる
GUIによる操作だけではなく、Hidden Layer設定でいろいろな設定が可能
だと思われる



37 :名無しさん@3周年:2005/06/18(土) 23:04:18
>>31
汎化能力あげるために、いらない特徴を消したり、
損失関数に正則化項加えたりってのは意味あるんじゃないの?

38 :名無しさん@3周年:2005/06/19(日) 09:25:14
>>37
実務ではない。

39 :名無しさん@3周年:2005/06/19(日) 10:52:06
>>38
オーバーフィッティングとかどうするの?
経験とカンでうまく特徴選択してるの?

40 :名無しさん@3周年:2005/06/19(日) 11:58:24
AIC!AIC!

41 :名無しさん@3周年:2005/06/19(日) 14:32:05
>>37
線形モデル限定の話題はそろそろヤメレ、視野狭すぎ
清く正しいマイナーは、検証データを使う



42 :名無しさん@3周年:2005/06/19(日) 15:23:57
まぁ純粋マイナーは数学的に検証するだけの数学力がないから。

43 :37:2005/06/19(日) 15:36:30
>>42
ごめん。でも一応線形モデルに限った話をしてるつもりはなかったんだ。
特徴選択しないみたいにかいてあったから、ちょっと疑問に思っただけ。
結局、クロスバリデーションかなんかで色々試したりして特徴選んだり、
正則化項の係数とか決めるんでしょ?

44 :37:2005/06/19(日) 15:39:14
間違えた >>41

45 :名無しさん@3周年:2005/06/19(日) 15:40:34
ツールはどれも高いよな。200万とか個人じゃだせない。

46 :名無しさん@3周年:2005/06/19(日) 23:19:03
>>45
個人使用なら、さんざん既出のWEKAだね。
使い勝手、動作の安定性はいまいちだが、主だったマイニング手法は
揃っているし、最近じゃ市販のツールが備えているプロセスフローを
アイコンと矢印によって図式化して実行する環境まで揃えている。
WEKAが決定木だけのツールだなんていうのは、どこぞの頭悪い工作員
の発言としか思えない。
市販ツールには200万円以上の価値があると認めている一人だが、
手法の数や機能の比較だけでその価値を語ることはできないのさ。

47 :名無しさん@3周年:2005/06/20(月) 22:23:30
WEKAはJave製ってだけでアウト


48 :名無しさん@3周年:2005/06/20(月) 23:00:04
アイコンのドラッグドロップは素人だけに必須の機能。


49 :べべ:2005/06/27(月) 21:49:35
複数の目的変数があるときいっぺんにマイニングしてくれるソフトはありますか?
たとえば説明変数x1, x2, x3に値を与えたとき、目的変数y1, y2を一度に
出力してくれるソフトです。
y1, y2は量的尺度でも名義尺度でも。


50 :名無しさん@3周年:2005/07/02(土) 17:50:22
wekaってどらくらいの件数のデータ読み込めますか?
2000万件くらいのCSVデータ読ませてるんですが1時間してもロードが終わりません・・・

51 :名無しさん@3周年:2005/07/15(金) 00:02:47
>>50
2000万件はすごいですね。実務では普通ですか?
クレメンタインだったらどれくらいの時間で読み込んでくれるでしょうかね?
まあ、PCの性能によるんでしょうね。

52 :名無しさん@3周年:2005/07/15(金) 21:42:15
age

53 :べべ:2005/07/22(金) 00:42:05
WEKAのバージョンが 3-4-5 にアップしました。
3-4-4 で発生していた visualize のバグが無くなってます。つまり、
プロットをクリックするとインスタンスの情報が表示されるようになり
ました。
 きちんとメンテをしていることがわかりましたので本格的に使ってみ
ます。


54 :名無しさん@3周年:2005/07/26(火) 21:59:09
>>47
言語はよく知らないのですが、JAVAってバグでも多いんですか?

55 :名無しさん@3周年:2005/08/07(日) 02:52:03
いまいち盛り上がらんね


56 :名無しさん@3周年:2005/08/16(火) 05:54:20
>>47
何製ならおまえは満足なんだ?

57 :名無しさん@3周年:2005/08/17(水) 00:10:25
C or C++が望ましい。

理由はjapaより速いのと、個人の好み。
japa

58 :名無しさん@3周年:2005/08/22(月) 19:18:45
>>31-33
教科書見たら「マルチコの回帰式は問答無用で破棄すること」とか書いてあって、
素直にそれを信じてたんだけど、実務だとマルチコになっても全然OKってことなんですかね?
すごい・・・目から鱗です!

できればその辺詳しく教えていただきたいです。

59 :名無しさん@3周年:2005/08/23(火) 00:32:24
>>58
目的が予測(Prediction)か推定(Estimate)かということかと
一般的なデータマイニングはモデルの構造より予測精度が重要なのです。
線形回帰で精緻にモデル構造を同定するようなケースでは、
マルチコには気をつける必要がある
マルチコ発生状態ではモデルの予測値は安定していたとしても
パラメータ推定結果はふらついていて、たまたまモデルがそういう
構造になっただけかもしれないからね
リッジは荒っぽい言い方をすると、分母が0付近になる様なクリチカル
ポイント(Rank落ち)を意図的にちょいとずらしてパラメータ推定結果を
安定させるテク

60 :58:2005/08/23(火) 19:34:48
>>59
THXです。
データマイニングの基本から分かってないもんで、勉強になりました。

61 :べべ:2005/09/17(土) 08:44:25
>>60
製造現場でマイニングを使うならマルチコは常に注意
しないといけないね。 主因子を誤ってしまうと現場
から怒鳴られ、ITなんか信用できねーとけちをつけ
られます。   (っておどかしたりして)
 実践を積みながらまたは例題を解きながら理論を勉
強されることをお勧めします。


62 :名無しさん@5周年:2005/09/17(土) 09:04:33
>>61
それはマイニングというか統計学だろ。


63 :べべ:2005/09/17(土) 21:19:30
>>62
 ベイズ統計やニューロ、重回帰、決定木をすべて使ってますので、
この意味ではマイニングでしょうね。 それでどの手法もマルチコ
の影響は受けます。影響を受けやすいのと、受けずらいのとがあり
ます。

 それと統計学はマイニングの一部というか、必須科目と考えていま
す。 ベイズ統計は統計学ですが、情報を掘り起こすのにとても役
立ってますのでマイニングの一手法だと考えてます。

 重回帰以外の手法でマルチコの説明をしている文献って知りません
か?

64 :ななし:2005/09/18(日) 10:07:15
製造の現場では信じられてないんだね

65 :べべ:2005/09/22(木) 02:00:43
>>64


66 :名無しさん@5周年:2005/10/08(土) 22:59:19
現場で一番使われてる判別手法は何ですか?

67 :名無しさん@5周年:2005/10/08(土) 23:39:27
k-NN …と予想してみる。

68 :名無しさん@5周年:2005/10/10(月) 16:03:37
67は学生

現場では線形判別分析とロジスティック回帰が半々。
それが現実

69 :名無しさん@5周年:2005/10/29(土) 00:57:01
KDDってなんだ

70 :名無しさん@5周年:2005/10/29(土) 03:20:44
今はKDDIだよ。

71 :名無しさん@5周年:2005/10/29(土) 04:56:25
現実ってなんだ

72 :名無しさん@5周年:2005/10/30(日) 17:35:23
なんでKDDとKDDIがデータマイニングと関係あるのですか?

73 :名無しさん@5周年:2005/11/01(火) 23:02:48
ナレッジ・・・なんだっけ?

74 :名無しさん@5周年:2005/11/03(木) 23:44:45
ことしはシカゴ、来年はフィラデルフィア

75 :名無しさん@5周年:2005/11/06(日) 08:16:11
JAVAは理解できないよ結局はオブジェクト指向がわかんないんだね

76 :名無しさん@5周年:2005/11/06(日) 08:22:02
Cで十分だよ、数値計算だもん

77 :名無しさん@5周年:2005/11/07(月) 23:57:44
>>63
特異モデルの漸近的挙動解析なら東工大の渡辺澄夫チームなのでは。
IBIS2005にも出してるみたいだが、今年のテーマもそれなのかは見てない。

78 :名無しさん@5周年:2005/11/10(木) 21:53:55
だれかIBISいったか

79 :名無しさん@5周年:2005/12/15(木) 17:12:13
決定木のboostingのフリーソフトありますか?

80 :マイニング素人:2006/01/02(月) 16:12:16
個人でデータマイニングを勉強しているが、なかなか進まないが苦戦している。
どうやって進めたらいいんだろうな??
本気です!!!!!!

81 :名無しさん@5周年:2006/01/31(火) 03:41:43
>>80
漏れもリーマンで畑違いの文系大学中退野郎なので
下地の知識が全くないけど、参考図書とか日本語サイトとか
ぜひ教えていただきたいです!

実は最近になって、取り扱い商品(200万点以上!)の
新しい視点からの分類を業務でやらなくてはいけなくなり、
カテゴリー立てとそれぞれの商品を分類する作業を
自動化するためにデータマイニングを行う必要が出てきたわけです。

商品のスペックなどは既にデータベースに入ってるし
新規項目の追加作業や入力作業は外注で
サマーシーズン(6月)までに仕上がればいいのだけれど
肝心のカテゴライズなどを専門家や企画会社に外注する予算が
見積もりで専務段階で不許可になってしまったため
社内チームで知恵を絞って片付けてしまおうということに・・・。

せいぜい十数万くらいのソフトや参考書を購入する程度の
予算しかおりないはずなので、頭痛いです。

82 :名無しさん@5周年:2006/02/06(月) 21:28:23
その十数万でオレを雇え

83 :名無しさん@5周年:2006/02/07(火) 02:14:02
>>80
ttp://blogs.yahoo.co.jp/pironotakarabako/6583234.html


84 :名無しさん@5周年:2006/02/07(火) 03:44:19
>>83
どうもありがとう!
でも難しくてよく理解できませんでした。
SVMや決定木は知ってるけど上っ面しか知らなかったので。
・・・勉強必要ですね。

85 :名無しさん@5周年:2006/02/11(土) 21:12:43
Linux板
【金鉱脈】データマイニングのスレ【発見】
http://pc8.2ch.net/test/read.cgi/linux/1139645444/

86 :名無しさん@5周年:2006/03/23(木) 14:25:49
シンプルで使いやすそうだけど、精度がわからん。
http://www.datamation.jp

87 :名無しさん@5周年:2006/03/24(金) 03:56:44
http://www.nag-j.co.jp/DMC.htm

・アソシエーション (Association)
・k-meansクラスタリング
・階層的クラスタリング
・決定木 (GINI、エントロピー)
・一般線形モデル
・Nearest neighborモデル
・ニューラルネットワーク (多層パーセプトロン(MLP))
・回帰の木
・線形回帰
・ロジスティック回帰
・ラジアルベーシス関数 (Radial basis function - RBF)

サンプルコードあり

88 :名無しさん@5周年:2006/03/27(月) 07:21:39
NTTのカーネルつかった構造マッピング熱いな。ちんこ。

89 :名無しさん@5周年:2006/03/27(月) 08:22:21
SOMは無いのですか。
BASICなどで書いて実際に動かしてみると良く分かると思います。


90 :名無しさん@5周年:2006/04/17(月) 23:21:38
君達は本当にマイニング成果がでると思っているのか?度数分布と産婦図で目で見るのが一番早いマイニングだぞ。遺伝的アルゴリズムの結晶だからな。本当にそう思うよ。マルチ子もこそも、数字のお遊びか?

91 :名無しさん@5周年:2006/04/21(金) 22:09:10
>>90
素人は引っ込め

92 :名無しさん@5周年:2006/05/15(月) 05:16:35
Webマイニングとかもここでいいんですかね??
いまいち分類が分からなくて。。。

93 :名無しさん@5周年:2006/06/24(土) 23:08:32
マイニングしてるやつは荒らしばかりだね。

94 :名無しさん@5周年:2006/08/10(木) 21:57:58
混合正規分布おEMアルゴリズムをC言語で書いたプログラム探しているんですけど、
どこかで公開してないですか?

95 :名無しさん@5周年:2006/08/22(火) 00:16:29
”データマイニングが従来の統計分析と一線を画して語られるのは、取り扱う情報が、
質と量の両面において異なるから”?
数式を使わないデータマイニング入門  岡嶋裕史 光文社 2006/05/17
http://d.hatena.ne.jp/starocker/20060521

96 :名無しさん@5周年:2006/08/29(火) 18:49:03
k nearest neighbor法を自分で実装したいんだが
なんか参考になりそうなサイトはないだろうか

97 :名無しさん@5周年:2006/08/30(水) 06:32:45
どっかのソースコードを読むのがオススメ。
オレは matlab で書くときに  somtoolbox の knn を真似したら早くなった。
euclid 距離の計算が秀逸だった(確かそこは別ファンクションだったと思うが)。

98 :名無しさん@5周年:2006/08/30(水) 20:43:46
さんくす
matlabは使ったことないんだが
somtoolboxをDLしてknn.mを覗いてみた
やはり√は計算せずに
squared euclidean distanceだけ計算して遅延処理するんだな

計算が秀逸だってのはここの部分?
% Euclidean distance matrix between row vectors in X and Y
U=~isnan(Y); Y(~U)=0;
V=~isnan(X); X(~V)=0;
d=abs(X.^2*U'+V*Y'.^2-2*X*Y');

99 :名無しさん@5周年:2006/08/31(木) 10:21:13
>>98
そそ。おれなんかだと2重ループはしないまでも1重ループはしちゃってたから
全然速度が違った。ソースコードを読んでいなかったらそんな手法があるなんて知らずにずっと過ごしていたかもしれない。ガクブル

100 :名無しさん@5周年:2006/08/31(木) 10:24:14
>>98
あ、matlab を使ったことがないということなので一応。
matlab では for ループを使う処理をしないでできるだけ built-in 関数を使うようにするのが肝要なんです。早さが段違いに。

101 :名無しさん@5周年:2006/08/31(木) 19:42:41
>>100
ああ、最初暗号に見えてたんだが
これ因数分解した後に、多分転置行列を使って
ループ処理に相当するものを実行してるわけだよな、気づかなかった

C++でだけどsomtoolboxも一部参考にしながら
KNN法、何とか実装完了できますた
色々ありがとな!

102 :名無しさん@5周年:2006/09/24(日) 14:00:54
TRUE TELLERって、使えますか?
http://www.trueteller.net/

103 :名無しさん@5周年:2006/09/27(水) 18:29:35
ただのとおりすがりです。

昔、某企業でいろいろクライアントを抱えてデータマイニングやってました。
なかなかクライアントの要求するような精度・品質のモデルや分析ができることは少なく、実務をやっていた人間としてはつらい分野でした。
会社のバックアップ体制があまりよくありませんでした。短期間で成果を出す必要があったのです。
あのころのチームの人たちは離散して、多数が会社を辞めてしまいました。仕事の方向性もデータマイニングからみな離れてしまいました。私もです。
データマイニングを仕事にするならば、やはりちゃんとした長期的な自己研鑽、研究ができるような事業会社・大学などの機関のバックアップを得て、ちゃんと長期的にデータを見ていける立場でデータマイニングをする仕事を得られればよかったのかな、と思います。


104 :名無しさん@5周年:2006/09/29(金) 15:41:41
プロなら短期的に成果を出せなければウソでしょ。
長期的に研鑽しなければならない、ってことはプロとしての
技量がまだないうちにクライアントを持っちゃったってこと
ですよ。
いろいろなアルゴリズムを一通り勉強して、ケースバイケース
で使い分けて・・・ってなんて甘いこと言ってるとプロに
なれないんですよ。これ、一般的に信じられている
「データマイニングの常識」のウソなんですよ。
だって、1つ1つ研究すれば学術論文が書けるほど奥深いものです。
そんなものを全部やろうとしたらものにならなくて当然ですよ。
「いろいろできる」は、「何もできない」ってこと。
自社のアプローチをしっかり持っている、ってことがプロの要件です。
いろんなアルゴリズムが詰まった有名なデータマイニング・システム、
あれ危ないですねえ。ご愁傷さまです。













105 :名無しさん@5周年:2006/10/01(日) 02:14:08
重回帰分析法も、データマイニング手法に入るのか?
データマイニングの基礎編
http://www.nikkei-nbsonline.com/course/kouza_xav50501.html

106 :名無しさん@5周年:2006/10/01(日) 03:27:13
データマイニングソフト CATDAP for Windows
統計数理研究所が開発した主なプログラム
http://www.ism.ac.jp/computer_system/software_j.html

107 :名無しさん@5周年:2006/10/02(月) 09:51:23
>105
タイチローさんですね。たくさん本出してるけど、正直、
データマイニング業界は迷惑してるよ。
統計はデータマイニングに含まれるけど、統計=データマイニング
じゃないからね。「ニューメディア」とか「マルチメディア」とか
かつの流行語は、どれも便乗組がその言葉を多用することにより、
定義があいまいになり、最終的に死語になって行ったよね。
「データマイニング」も同じ経過を辿ったね。
出版社もちゃんとした見識を持って欲しいものだ。

108 :名無しさん@5周年:2006/10/09(月) 08:31:11
>>104
あなたはただの研究者で実務経験がなさそうだ。


109 :名無しさん@5周年:2006/10/10(火) 05:06:34
108に同意。研究者は実務能力に欠ける。なにせ、コミュニケーション能力ないから。大学の先生が会社で使えるのは稀。

110 :名無しさん@5周年:2006/10/13(金) 16:41:41
>108
>109
104で言っていることの意味が理解できてる?
コミュニケーション能力の達人さま。

111 :名無しさん@5周年:2006/10/13(金) 22:33:18
データマイニング関連のプロでベンチャー起業に興味ある人いる?

112 :名無しさん@5周年:2006/10/14(土) 05:45:11
>110
研究室でご苦労様。実社会では使われない研究ガンバだ。一度も実社会でやったことないのでは?

113 :名無しさん@5周年:2006/10/14(土) 10:46:39
>>110
108だけど、自分はコミュニケーション能力について言ってるわけではない。
104は実務の中でクライアントは数学的な細かい話なんて誰も興味がないって事が解ってなさそうだなと思っただけ。
数学的な精確さより、いかに巧くアウトプットを見せられるかが重要。

>>111
そういった会社も結構ある(あった)けどどこも芳しくなさそう。
理由は実務でデータマイニングに携わっている人間ならわかるでしょ?

114 :111:2006/10/14(土) 14:01:52
いわゆるデータマイニングに携わってないが
情報の価値が低いか 市場の開拓からやらないといけないからかな
しかも米国の真似が基本で 自ら作った技術じゃないものな


115 :名無しさん@5周年:2006/10/14(土) 15:24:59
ま、すべてのクライアントがデータマイニングの
価値・必要性を正しく理解し、すべてのデータマイナーが
目的に合った正しい手法を正しく適用して、まともな
成果を上げる、ということは夢物語ですよ。
世の中の2/3ぐらい(いやそれ以上?)は間違いだらけ、
というのが現実。それでも、データマイニング技術の
すべてがウソだというわけではなく、ちゃんとした成果
の出る状況、方法、ツールは確かにあります。
結局、自分がヘボなグループに入るのか、まともな
グループに入るのか、ということですよ。
少なくとも総花的な解説書やツールは、手ごろな教材には
なっても、実用向けじゃないってことは肝に銘ずべきかと。

116 :名無しさん@5周年:2006/10/15(日) 03:53:02
まともにやってる会社あるんかな?

117 :名無しさん@5周年:2006/10/15(日) 09:27:33
少なくとも海外ではちゃんと機能してるよ。
それを日本に持ってくるとよってたかってヘボにしてしまう。
現在の日本でのデータマイニングは、戦前の品質管理のような
段階だね。欧米に決定的に差をつけられていることに気がつく
までは、真剣に取り組むことができない。
真剣に取り組むと、10年か15年ぐらいで追いつくことはできる
でしょ。そうすると、また「日本型」という思想が出てきて、
良い面もあれば、悪い面もあったりと。良い面は徹底して洗練
させるとこだが、悪い面は宗教みたいに、あるいはバカの一つ
覚えみたいになってしまうとこだな。
現段階ではまだ安直に「日本型」みたいな変形をすると、
骨抜きになってろくなことがない。

118 :名無しさん@5周年:2006/10/15(日) 15:18:26
ベンダーの説明自体が宗教的だ。この前、S○Sのデモ見させられた。某社では稼動してますと言ってた。しかし、その担当にきいたら何にも使ってない。マニュアルが全部英語でわからんと。英語はともかくさ、買えばできると思ってる。数千万ドブ。

119 :名無しさん@5周年:2006/10/15(日) 17:58:35
ほとんどの人は、統計ソフト・ベンダーとデータマイニング・
システム・ベンダー(BIプロバイダー)の区別がついてない。
良質で独創的なデータマイニング技術を持っている会社は、
残念ながらそんなに大きくない。アカデミックでは有名でも、
ビジネスの世界ではまったく無名。当然、日本には本格的な
営業基盤を持ってない。宣伝もしてなきゃ展示会にも出てない。
だから、フツーの会社には気づかれてもいない。残念。
日本語版まであっても、フツーの人は気がつかない。
蛇の道は蛇で、評価眼のある人間にしかピンと来ないように
なっている。質の悪いクライアントを持つと商売にならない
のでクライアントを選んでるのだ。したがって、けっして安く
はないが、有名ベンダーよりもずっと良質なサポートが可能。
ファーストフードと高級レストランの違いみたいなもんだな。

120 :名無しさん@5周年:2006/10/15(日) 23:00:29
強力な熱意とリーダーシップが必要だろうな。疲れ果てる。もうあきらめ。

121 :名無しさん@5周年:2006/10/16(月) 23:21:21
>>117=>119

はやく学部を卒業しような。



122 :名無しさん@5周年:2006/10/16(月) 23:33:48
>121
研究室のお子様は引っ込んでろ。

123 :名無しさん@5周年:2006/10/16(月) 23:39:25
結局、データマイニングやってるのはお子様ばかり。
それが根本的問題か。オモチャじゃないんだよ。

124 :名無しさん@5周年:2006/10/17(火) 00:13:33
そりゃー、大学の研究室では世間ズレしたことしてるよ。DBから分析データを
ブレークダウンして作ることから始まるわけなんだけど、先生も生徒も
それをどうするかも知らなかったわけ。OracleとかSQLの操作もあんまり
できないわけよ。国公立の大学だった。会社派遣で行かされて気を失った。
まあ、おままごとしてな。

125 :111:2006/10/17(火) 03:19:08
意味あるのは バイオと金融ぐらいか

126 :名無しさん@5周年:2006/10/19(木) 21:18:40
占いのほうが当たる。

127 :名無しさん@5周年:2006/10/20(金) 14:17:39
予測がマイニングのすべてじゃないぞ。
ベンダーにも責任の一端があるが安直な結果を期待するからダメなのよ。
たとえばCRMに使うのなら、本気で顧客を理解しようとしているかどうかだよ。
そうじゃない香具師が使うからオモチャにしかならないんだよ。ばーか。
お子様はさわるな。

128 :名無しさん@5周年:2006/10/20(金) 14:40:14
誰に向かってかいてんの?

129 :名無しさん@5周年:2006/10/23(月) 22:22:30
顧客の財布を理解したい

130 :名無しさん@5周年:2006/10/24(火) 12:17:01
データマイニングは人様が苦労して作業するほど価値のない仕事を自動化できる程度

131 :名無しさん@5周年:2006/10/24(火) 20:03:50
その指摘は当たってる。確かにそうだ。

132 :名無しさん@5周年:2006/10/24(火) 21:12:35
システム化ってのはそんなもんだ。馬鹿だなぁ・・・

133 :名無しさん@5周年:2006/10/25(水) 22:28:51
なんでブームみたいになってんの?教えて中のひと。

134 :名無しさん@5周年:2006/11/02(木) 08:23:45
遅刻

135 :名無しさん@5周年:2006/11/10(金) 00:07:19
somtoolboxのsom_bmusを使いたいのですが・・・
どうすれば使えるのでしょうか?
アドバイス、よろしくお願いします。

136 :名無しさん@5周年:2006/11/12(日) 05:30:47
SMなら教えよう

137 :名無しさん@5周年:2006/11/12(日) 10:44:03
マニュアルどおり使えばよいと思います。

138 :名無しさん@5周年:2006/11/13(月) 01:03:47
ローソクとムチ

139 :名無しさん@5周年:2006/11/14(火) 01:28:03
俺さ、google抜く検索エンジン作ったんだけどさ、
政治家東大理3卒医師や一流ブランド大企業の奴らには使わせたくないんだ。
どうやったら識別出来る?

あと、米系大手外資系証券米系戦コン正社員にも
使わせたくないんだ。どうやったら識別出来る?







140 :名無しさん@5周年:2006/11/14(火) 01:29:43
あとキー局の奴らも使えないようにしたいんだ。
どうやったら奴らからのアクセスを識別出来る?




141 :名無しさん@5周年:2006/11/14(火) 08:29:11
君、正常になりたまえ

142 :名無しさん@5周年:2006/11/14(火) 20:14:27
【SONY】PS3の裏の裏
http://etc4.2ch.net/test/read.cgi/motenai/1163269007/


143 :名無しさん@5周年:2006/11/15(水) 08:30:23
ケーキ、乳頭

144 :名無しさん@5周年:2006/11/27(月) 00:27:47
ぶら下がり社員

145 :名無しさん@5周年:2006/12/10(日) 10:00:27
ROC曲線とゲインチャートって別物ですよね??

146 :名無しさん@5周年:2006/12/12(火) 00:54:44
よし、つっこめ

147 :名無しさん@5周年:2006/12/17(日) 11:59:44
SAS最高

148 :名無しさん@5周年:2006/12/17(日) 19:18:46
の価格


149 :名無しさん@5周年:2006/12/18(月) 00:36:19
天皇陛下に失礼

34 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)