オープンソースカンファレンス2015 Tokyo/Fall に参加しました(2日目)
掲題の通り
2015年10月24日、25日に開催の
オープンソースカンファレンス2015 Tokyo/Fall に参加しました。
25日(2日目)の参加報告を簡単に記載します。
OSC2015 Tokyo/Fall公式ハッシュタグ:#osc15tk
<<2日目>>
■高機能アクセス解析ソフト Piwik の紹介・活用法
Piwikってまったく聞いたことなかったので、試しに聞いてみました。
「ぴーうぃっく」
と読むそうです。
OSSなWeb+モバイルアクセス解析プラットフォーム
らしいです。
コミュニティが毎月活発らしい
リファナースパム?に対策をGithubで公開中
結局よくわからなかったので
とりあえず公式サイトを貼っておきます。
■PostgreSQL 9.5の新機能紹介
10月6日のSRA OSS社のイベントとほぼ同じスライドでした。
いろいろ新機能はありますが
スライドを見た方が早そうなのでリンクを貼っておきます。
■分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向
Hadoopとはなんぞや?
からの説明と下記2点の紹介
Apache Hive:
HiveQLというSQLライクな言語でMapReduceを実行
Apache Pig:
Pig Latinという独自の言語でMapReduceを実行
また新たな並列分散処理エンジンの出現として下記の紹介
Apache Spark:
大規模データの分散処理をオンメモリで実現
スライドがすごくよかったんで、メモをあんまりとってなかったです。。
公開されたら嬉しいです。
■pgpool-II 入門! ~PostgreSQL 用クラスタツールの使い方を基礎から学ぼう~
資料が公開されるようです。
なので簡単に記載します。
pgpool-IIとはPostgreSQLのクラスタツールです。
データベースクラスタリングの目的は3つ。
1.高可用性の確保
サービスを停止させたくない
1つのデータベースが故障しても別のデータベースが肩代わり
2.参照負荷分散
大量のアクセスをさばきたい
3.並列処理
大量のデータを解析したい
で、PostgreSQLのストリーミングレプリケーションには課題がある。
ストリーミングレプリケーションの課題
負荷分散 更新クエリ・参照クエリの振り分け
DBサーバに障害が発生したら手動で対応するのか
プライマリがダウンしたら更新ができなくなる?サービスが停止してしまう?
pgpool-IIとは
アプリケーションとPostgreSQLの間に入ってクラスタリング機能を提供するミドルウェア
アプリケーションからみると普通のPostgreSQLに見える
BSDライセンス
・参照負荷分散
クエリの自動振り分け
更新クエリはプライマリサーバへ
参照クエリはサーバ間で振り分け
・自動フェイルオーバー
プライマリサーバに障害が派生した場合
負荷分散からの切り離し
スタンバイをプライマリに自動昇格
・オンラインリカバリ
ダウンしたスタンバイをプライマリに同期させる
同期中も更新が可能
・インメモリクエリキャッシュ
SELECTクエリの結果をメモリ内にキャッシュする機能
同じクエリが着た時に再利用する
DBへのアクセスが減り、性能向上
などなどの便利な機能が使えます。
ちなみに
pgpoolAdminというGUIツールもあるそうです。
▲各展示ブースをまわる
空き時間に各展示ブースを巡ってました。
前日と大きな変更はなかったです。
ただ、
「IBM Cognos」
というBIツールを某ブースで教えていただきました。
BIツールはたくさんありますが、この子はなかなか簡単操作でできるっぽいので
別途調べてみようと思います。
★2日目の所感
初日とは違って、初めて聞くOSSやツールについていくつか知ることができました。
どれも便利そうなので、別途調べて使ってみたいと思います。
★★全体の所感
セッションでも各展示ブースでも、あちこちで
「fluentd」
を使ってることが多くて、これが一番ホットなんじゃないかと思いました。
ログの収集ツールとしてデファクトスタンダードにまでなっている?
実際に触ったことがないので、fluentdは要チェックしようと思います。
で、2日間参加させていただきましたが
とても楽しく充実してました。
明星大学は都心からやや遠いですが
それでも参加する意味は大いにあると感じました。
以上