【IT】データサイエンティスト職に求められる言語のトップに「Python」--「R」を上回る

1田杉山脈 ★2019/01/12(土) 18:37:50.17ID:CAP_USER
「Python」と「R」はデータサイエンティスト職の求人で最も多く要求されるスキルに数えられている。ところが、こうしたプロフェッショナルの仕事で最も頻繁に使用されているプログラミング言語について調査した複数の報告書によると、実際は評価が分かれるという。Cloud Academyの米国時間12月27日付の報告書で明らかになった。

 まず、TIOBE Programming Community Indexによれば、2018年の検索エンジンのリクエスト数でみたRの順位は下降気味だったという。だが、データプロフェッショナル1万6000人を対象に実施したKaggleの調査では、全体で最も人気の高いプログラミング言語はPythonであるものの、統計およびデータサイエンティストは他のどの職務よりも業務でRを使用している割合が高いことが分かった。データサイエンティストの87%はPythonを、71%はRを業務で使用していると回答していると、同報告書に記
以下ソース
https://japan.techrepublic.com/article/35131060.htm

100名刺は切らしておりまして2019/01/13(日) 17:13:09.10ID:kxpdShTD
データオナニスト職にはどんな言語が求められるの?

101名刺は切らしておりまして2019/01/13(日) 17:19:52.92ID:iT7GDQh4
S言語やろ

102名刺は切らしておりまして2019/01/13(日) 17:32:33.57ID:rhsezMRT
>>100
すごいH本を読んでマサカリマスターになることが求められる
パイソンのインデントが好きならオナニストへの道はおのずと開けよう

103名刺は切らしておりまして2019/01/13(日) 17:44:29.55ID:4qHb4AL0
>>100
>>102
まじレスするとJPGのバイナリ眺めるだけで画像の内容がわかるwww

良い子は真似しないようにねw

104名刺は切らしておりまして2019/01/13(日) 18:21:48.70ID:ldWl6bNC
>>6
スピードかかる所は
Cのプラグイン化でええだろ

105名刺は切らしておりまして2019/01/13(日) 19:23:23.14ID:+BOauHG8
Rは時代の敗北者じゃけえ

106名刺は切らしておりまして2019/01/13(日) 19:46:14.85ID:kjkKo3BF
統計つかうときはEZRでやってる
本職でもなんでもないし

107名刺は切らしておりまして2019/01/13(日) 19:47:59.32ID:V2X5Wl0W
>>100
ヘブライでヤハウェ様にオナンの罪を詫びる

108名刺は切らしておりまして2019/01/13(日) 19:49:20.08ID:HTfs0EzX
【ネットカフェ難民】 オランダでは空き家があったら勝手に住んでよし、自民党はローン破産者を立退き
http://rosie.5ch.net/test/read.cgi/liveplus/1547370054/l50

109名刺は切らしておりまして2019/01/14(月) 01:07:16.91ID:ANYUp8A4
抽象的な話じゃなくてデータサイエンティストのすごい論文って具体的にどれよ

110名刺は切らしておりまして2019/01/14(月) 02:56:00.78ID:DWDpj2yF
>>6
R は Pythonに輪をかけて遅い。
Python自体はスクリプト言語だからメチャ速くはないけどCで書かれたnumpyやpandasをうまく活用してPythonはそういった外部ライブラリを繋ぐ糊だと考えればいい。

111名刺は切らしておりまして2019/01/14(月) 09:11:53.57ID:VFbIvcx/
>>110
思うんだけど、matlabとかR使ってる研究者って
競争に負けないように、GPGPUとか3Dハードウェアアクセラレーションを使える
高度なソフトを勉強しようとは思わないのかね?

112名刺は切らしておりまして2019/01/14(月) 09:45:33.15ID:+vGczbyk
>>111
matlabとかRってGPU使えないの?

113名刺は切らしておりまして2019/01/14(月) 10:03:40.12ID:VFbIvcx/
>>112
調べたらAI用途でならあった
https://www.mathworks.com/solutions/gpu-computing.html
これならどの言語、どのアプリ使っても対して違いはないね

114名刺は切らしておりまして2019/01/14(月) 10:43:03.42ID:DXceOEIq
>>103
人工知能を研究している人間の中には、マジでそういう能力持ってるやついるらしいな。

115名刺は切らしておりまして2019/01/14(月) 10:44:03.49ID:DXceOEIq
>>113
無料じゃないなら意味なし。
片手落ちだよ。

116sage2019/01/14(月) 10:53:44.11ID:GZJXSzNG
>>115
>無料じゃないなら意味なし。
年収2000万ごえのプログラマーの意見ではないな?

117名刺は切らしておりまして2019/01/14(月) 10:56:34.57ID:YEh02L37
>>111
CPUとGPGPUで計算結果に相違が出るなんてしょっちゅうだし
GPGPU上で使えるライブラリ激減するし
使えるメモリ明らかに減るしで
使い所がかなり限定されるものに大金出すアホはそうそういないw

118名刺は切らしておりまして2019/01/14(月) 11:04:30.82ID:12jd86v2
>>110
別に研究者全員がごりごりの計算屋じゃないんだって。
MATLABだと10秒かかる計算をCだったら1秒以内だからって,
わざわざコンパイラ通すプログラム作るより楽でしょ?
俺の場合はMATLABで10時間以内で計算できるんだったら,MATLAB使うかな。
プログラムできてしまえば,一晩置いとけばいいからね。
CはMATLABじゃ数日かかってしまうようなものオンリーだな。
俺はプログラマーとしては素人同然なので,配列の面倒くさいポインターとかを考えるの嫌なんだよ。

119名刺は切らしておりまして2019/01/14(月) 11:09:59.92ID:ILDDor57
データサイエンスに求められるレベルが違うんだよなあ
pythonができる人がただ、データーを半分にして重回帰しただけのものを機械学習って言われてもただ、条件分岐を数学的にやってるだけ
Rは統計ができる人が使うからデータサイエンスとしてのレベルが違う

120名刺は切らしておりまして2019/01/14(月) 11:11:09.30ID:VFbIvcx/
>>118
時代はGPUからFPGAに代わってきているし、Cみたいな高級言語覚えてもあんま意味ないよね
そう思ったとき、色々手早く動作テストするのには、適当に使える楽なPythonがいいという話になる

121名刺は切らしておりまして2019/01/14(月) 11:14:59.42ID:vGJIuwdy
R使う研究者とか、Python使う研究者とかそういうのはいないよ。
俺は研究者だけど、R, MATLAB, Python, C/C++, Java この辺は一通りできる。
周りもだいたいそう。
その時その時で使うライブラリによって使い分けてるだけ。

122名刺は切らしておりまして2019/01/14(月) 13:18:02.39ID:GDo+WvWK
底辺が大好きな言語やん

123名刺は切らしておりまして2019/01/14(月) 13:20:30.55ID:Z9j0/HNp
そりゃあそうだろ
研究者ならそれで別にいいけど
ビジネスでは全く違うから

研究者の世界を
ビジネスに持ち込まれても困るし
逆もまた然り

124名刺は切らしておりまして2019/01/14(月) 13:30:33.41ID:vGJIuwdy
>>123
ビジネスって言ったら全部ビジネスだよ。研究もビジネス。
プログラミングが関わってくる仕事は、
基礎研究、統計解析、商用開発、委託開発などなど色々あるってだけの話。

125名刺は切らしておりまして2019/01/14(月) 13:58:50.84ID:+vGczbyk
>>117
CPUとGPUの計算結果が異なることが問題になるって、
アルゴリズムがピーキーすぎんか?

126名刺は切らしておりまして2019/01/14(月) 14:12:44.47ID:MQZICMLT
>>2
それでいうと、現場を知らないと問題意識が芽生えないので、データの関係だけを明らかにはできるかもしれないが、意味のある分析はできない

127名刺は切らしておりまして2019/01/14(月) 16:19:26.23ID:cVDGiTvv
>>90
ワロタ

128名刺は切らしておりまして2019/01/14(月) 16:27:07.46ID:YEh02L37
>>117
アルゴリズムじゃなくてハードウェアの構成の違い
CPUとGPGPUとじゃ内部の加減乗除の計算順も
変わってくるから下数桁の違いなんてザラ

そんなもんだと割り切れる分野なら良いけど
カオス現象みたいに違いが深刻になる分野じゃ使えない

1291282019/01/14(月) 16:29:04.55ID:YEh02L37
>>117じゃなくて>>125の間違い

130名刺は切らしておりまして2019/01/14(月) 16:50:56.68ID:/UEfQiSk
日本語で会話しろよ。
さっぱりわからんぞ…

131名刺は切らしておりまして2019/01/14(月) 17:16:03.31ID:nQ4YlO+g
カオス現象は微細な数値の差で全体の挙動が歴然と違ってしまうから桁処理とかちゃんと揃えないとダメですって話だと思われ。。。

132名刺は切らしておりまして2019/01/14(月) 17:31:27.77ID:CoKRUuad
ハード、特にセンサーをいじれないからデータサイエンティストなんてクソ。

133名刺は切らしておりまして2019/01/14(月) 18:28:34.70ID:M0b3RSoy
R言語はデータ整形に使ってるけど
エクセル以上Python未満で使い所よく分からないイメージ

134名刺は切らしておりまして2019/01/14(月) 19:41:19.60ID:12jd86v2
>>132
あのね。ハード,特にセンサとか言ってるけど,話してるレベルが全然違うの。
センサっていうのはどのようにしてデータ取るかって手法なんだよ。
データ取得まで解析者がかかわれるなら,解析手法に合ったデータとりゃいいだけなの。
データサイエンティストってのは,ありもののデータをどうやって料理するのかっていう仕事なんだよ。
データはもうそこにあるんだよ。解析に向いていないノイズだらけのデータからいかにして
情報取り出すかって仕事なの。

135名刺は切らしておりまして2019/01/14(月) 20:04:54.12ID:+vGczbyk
>>128
カオスならそんなに神経質にならなくても良いんじゃ無い?
結果がカオスなのが当然なんだから。
そもそも、CPUだって仮数部52bitとかで切り捨ててるんだし。

136名刺は切らしておりまして2019/01/14(月) 20:34:40.84ID:hHdDfb9c
>>135
カオスだから滅茶苦茶でも良いわけじゃないよ?
初期値鋭敏性で結果が大きく変わって行くってだけで、それでも決定論的なのがカオスなんだから
同じ初期値なら一定時間後の結果は同じものが計算されてるって前提で計算出来なきゃ
計算してる意味無いよ

137名刺は切らしておりまして2019/01/14(月) 20:51:57.16ID:+vGczbyk
>>136
それ、CPUが変わったら結果変わりました
じゃ意味なくね?

138名刺は切らしておりまして2019/01/14(月) 21:16:36.93ID:hHdDfb9c
>>137
そうならないように精度保障とか使うんだけどさw

精度保障とかやってもCPUとGPGPUはアーキテクチャの違いが大きいから
同じ初期値でCPUかGPGPUかで違う結果が出てくる可能性がある事が問題なわけよ

139名刺は切らしておりまして2019/01/14(月) 21:18:03.41ID:CoKRUuad
>>132
そんなこと言ってるから仕事にならない。

140名刺は切らしておりまして2019/01/14(月) 21:20:14.98ID:CoKRUuad
システムを考えられない下請け屋がデータサイエンティストじゃん。

141名刺は切らしておりまして2019/01/14(月) 21:25:28.19ID:CoKRUuad
>>90
言いたいことはわかる。CかアセンブラでDLL作らないと悲惨なほどに遅い。
PythonもDLLを作ったほうが速い。
同じようなもんだよ。

142名刺は切らしておりまして2019/01/14(月) 21:39:45.26ID:U/LfWCmZ
RとPythonじゃちょっと用途が異なるんじゃ?

143名刺は切らしておりまして2019/01/14(月) 21:41:43.69ID:U/LfWCmZ
じゃあJuliaで。

144名刺は切らしておりまして2019/01/14(月) 23:20:58.64ID:1gk6uVin
GPGPUはもう時代遅れ。今後はTPUの時代

145名刺は切らしておりまして2019/01/15(火) 00:19:23.55ID:vnQAN2JM
>>134
捏造ですね。わかります by 厚生労働省

146名刺は切らしておりまして2019/01/15(火) 05:20:40.65ID:onYs7G8q
ロシアとか韓国のような弱小国を相手にするときは
 (ロシアのGDPは、韓国より少ない)
相手国のトップ(プーチン)以外は無視でいい!
  決済権限の無い下っ端ペーペーの 
  ふんどし担ぎのすっとこどっこいの
  何も知らない馬鹿な小役人(外相)
なんか相手にしても、時間の無駄である!
かまってやれば、付け上がるだけだ

147名刺は切らしておりまして2019/01/15(火) 16:02:21.89ID:y0e8IQD2
まあ普通に複数をつかいわけるよな

148名刺は切らしておりまして2019/01/15(火) 22:28:57.64ID:1NZLSlBE
データサイエンティストに将来がないと思いますよ。
GAFAのような起業をできなければプログラマと同じような労働者としてこき使われる事になるでしょう。
システムやビジネスがわからないからこそデータサイエンティストでいるわけでしょう。

149名刺は切らしておりまして2019/01/16(水) 01:32:25.24ID:5qfxudTu
>>48
プログラマもピンキリ,データサイエンティストもピンキリ。
単にそれだけ。

150名刺は切らしておりまして2019/01/16(水) 02:59:29.33ID:NnhXOF4C
>>120
Cはpythonと比べたら低級言語だろw

新着レスの表示
レスを投稿する