第28回ではHadoop Streamingの仕組みについて説明しました。今回は、 実際にHadoop Streamingを利用してデータ解析したときの具体的な話や、 利用してみて困った (ハマった) Hadoop Streaming特有の問題とその解決法について紹介していきます。 実際に利用してみて ...
CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。 講演資料・動画 ...
HadoopはGoogleのGFSおよびMapreduceのオープンソースクローンとして誕生しました。インターネットコンテンツが、 誰でもいつでもアクセスできるようになり利便性が上がる一方で、 過去の資産も含めるとその情報量は今や膨大なものとなっています。そのよう ...
CodeZine BOOKS(コードジン・ブックス)は、CodeZineの連載からカットアップした、開発現場の課題解決に役立つ書籍シリーズです。 CodeZineの連載「初めてのHBase」が元となり刊行した書籍『HBase徹底入門 Hadoopクラスタによる高速データベースの実現』が、現在 ...
Big data means big business. One of the most critical assets and organization has is the data that traverses the data center, the user, and the computing environment. All of this information needs to ...
Data management vendor Syncsort will announce on Wednesday its entry into the Apache Hadoop community, with plans to enable high-performance data sorts to be used with the open source distributed ...
Sybase is hoping its IQ analytic database can make its mark in the burgeoning “Big Data” market with an array of new features, including native integration with the open-source MapReduce and Hadoop ...
Oracle unveiled the Big Data Appliance, the newest addition to its line of products that combine software and hardware, during the OpenWorld conference in San Francisco on Monday. “Big data” is an ...