Windows XPサポート終了におけるIT業界の責任

Windows XPサポート終了におけるIT業界の責任(http://japan.zdnet.com/cio/sp_13matsuokaopinion/35044036/)という記事について、各所で色々意見されているので、私も纏めておきたい。

多くの論調は「ユーザー責任であって、IT業界に責任を求めるのは筋違いだろう」という物だが、ある面においてIT業界にも責任はあると思う。IT業界は維持運用にかかるコストについて、説明責任を果たしていなかったと思う。

独自開発したソフトウェアの維持コスト

日本では多くの企業が基幹システムとして、パッケージソフトをそのまま使うのでは無く、大幅にカスタマイズして独自機能を盛り込んだり、あるいは全くの0から独自システムを開発してきた。

これらのソフトを数年おきに発売される最新のOS等に対応させ続けるためには、本来なら開発者を囲って開発体制を維持するコストが必要になる。システムの細部の実装までドキュメント化して残しておくことはきわめて困難だし、また半年も担当から離れれば詳細な実装部分について忘却してしまうことは、開発者なら経験的に知っているはずだ。もし新しいOSや問題に迅速に対処しようとするなら、一定人数の開発者を開発完了後も独自開発したシステムに携わり開発体制を維持し続ける必要がある。

独自システムというのは作って稼働したからといって、そこで開発を終了してはならないものだった。昨今言う継続的インテグレーションを行ない、一定のコストを払い、常に改善や新機能の追加をし続ける必要がある。そうしなければ開発体制を維持する事は出来ない。

今多くの企業では、必要になってから技術者を集め、リバースエンジニアリングを行ないつつ、新たに開発体制を作り直すと言う方法を取っている。既存のシステムを解きほぐし、結果から過程を再現していくのは、相当に有能な人材を集めないと出来ないし、時間もかかる。また、古い開発環境と、新しい開発環境の両方に精通した人材を集める必要もあるので、構成人員のキャリアは高くなりがちになる。そのための予算も事前に考えてないし、コストも高く、人材も確保できず、時間も足りず、移行できない状況に陥っているのだろう。

 

ソフトウェアを売切りにしてしまったこと

二つ目のIT業界の責任は、パッケージソフトウェアを売切りにしていることだと思う。Windows XP発売当初、保守サポートの有効期限は区切られていなかった。ユーザーにとっては初期費用を払えば、追加コスト無しで使い続けられる製品だったわけで、ここに嘘がある。

安全に使い続けるためには保守が必要不可欠だというなら、売切りにすべきでは無かった。維持にコストがかかるなら、それを素直に料金体型に反映させるべきだったと思う。現在Adobeがいち早く対応したが、月額などの継続的に料金を支払い続けるシステムにすべきだったと思う。

WindowsXPだけの問題では無い

実はWindowsXPだけが大きな問題になっているが、同様の問題は他にも複数発生しつつある。

例えばAndoroidスマートフォンでは携帯電話メーカーからOSのアップデートが提供される事は殆ど無い。Andoroidの開発元であるGoogleは定期的にアップデートを提供しているにも関わらず・・・だ。セキュリティ上の問題はいくつも見つかっており、本来ならアップデートを提供すべきだが、売切りの状態のまま殆どの場合放置されている。もしセキュリティ問題の無い状態で使おうと思ったら、半年ごとに端末を買換える必要がある状況だ。でも携帯メーカーはそんな説明をしていない。

最近はTV等の家電もインターネットに接続する機能を有している。攻撃を受ける可能性もあるわけでセキュリティ上の問題が見つかればアップデートも必要なはずだが、アップデートは滅多に行なわれないし、いつまで無償でサポートするのか明示していない。

またメーカーが保守開発をひっそりと止めてしまったソフトウェアというのは沢山ある。一太郎や三四郎、ロータス123はすでに保守開発していないので、セキュリティホールは放ったままだ。Macintosh OSも最新バージョン以外は直ぐに保守を止めてしまうので、数年ごとにOSを買換えていないなら危険だ。

Windows XPに限った問題では無く、保守開発はコストがかかり、保守開発を維持していないソフトウェアを継続利用してはならないって、本質的な問題について議論する必要がある。

PythonをWinodwsにインストールする

日本国内ではRubyが幅をきかせていますが、海外ではC言語との親和性の高さと、豊富なサードパーティライブラリ群でPythonが人気を博しています。HadoopでMapReduceなアプリケーションを作る場合にも使えますので、WindowsへのPythonのインストール手順を確認しておきます。

PythonではVersion2.x系列と、Version3.x系列

PythonではVersion2.x系列と、Version3.x系列の2種類がメンテナンスされています。Version2.xとVersion3.xは言語仕様が異なるので互換性がありません。Version2.x系は変数に文字列型とUnicode文字列型の2種類があり、関数呼び出しの記述で括弧をかきません。これに対してVersion3.x系はUnicode文字列型だけになり、関数呼び出しの記述に括弧を付けるようになりました。現在主立ったLinuxディストリビューションに含まれているのはVersion2.x系列になります。ここではVersion2.x系をインスト-ルします。

どのPythonディストリビューションを使用するか?

Windows用に配布されているPythonにはPython.orgの純正版のほかに、ActiveState版等複数の亜種があります。

Pythonでは各種ライブラリやパッケージの管理にMyPIと言うツールを使います。WindowsでもMyPI自身は動作するのですが、パッケージをインストールするときにLinuxとの環境の違いからエラーとなることが少なくありません。それ以前にMyPIのインストールすら、ドキュメント通りにコマンドを実行しても失敗します。せっかくの豊富なライブラリなのに、いざ使うときに手間がかかるのはあまり嬉しくありません。

ここではActiveStateが無償で配布しているActivePythonをお勧めしておきます。ActiveState社がWindowsで動作するようにカスタマイズした状態で提供しているので、MyPIから問題なくパッケージをインストールできます。

ActivePythonのダウンロードとインストール

どのバージョンのPythonをインストールするべきかが分かれば、あとは簡単です。ActiveStateのダウンロードページから、必要なインストーラをダウンロードして実行するだけです。

MyPiを使ってパッケージのインストール

Pythonのインストールがおわったら、管理者権限でコマンドプロンプトを開き、以下のようにコマンドを実行します。

C:>pip install [パッケージ名]

例えば数値計算用のパッケージをインストールする場合は以下のようになります。

C:>pip install numpi

使いたいパッケージを探す場合には以下のようにコマンドを実行します。

C:>pip search [キーワード]

現在インストールされているパッケージを確認するには以下のようにします。

C:>pip list

 

Hiveのデータを圧縮して容量を節約する

LOAD DATAステートメントで取込むテキストファイルについては、Hive Language  Manualでもgzip形式で圧縮して取込むサンプルが例示されていますが、CREATE TABLE ~ STORED AS TEXTFILEで指定するテキストデータファイルに対してもgzipで圧縮して容量を節約することが出来ます。

特に気をつけるべき事はありません。テキストファイルを一つずつgzipで圧縮して、指定したフォルダに格納しておくだけです。

また圧縮することで処理速度が向上する場合があります。多くの処理系ではネットワーク帯域よりもメモリ帯域の方が圧倒的に高速なため、gzipで圧縮することによりネットワーク帯域負荷を下げる事によるメリットが、gzipの展開によるCPU負荷増大のデメリットよりも優るためです。

EMRを使う場合、巨大なデータをS3などのストレージに常時置いておくことによって発生する代金は馬鹿になりませんので、圧縮しておくことをお勧めします。

縦横に小計や合計が入っているエクセルシートを間違えずに作るために、意識すると良いポイント

縦横に小計や合計が入っているエクセルシートを間違えずに作るために、意識すると良い点を紹介してゆきます。

見せるための表とデータを保持するための表を分ける。
ユーザーに綺麗に見せるためのシートと、集計するためのデータを保持するためのシートは、分けて作ります。集計するシートには直接データを入力せずに、データ保持用のシートから、式を使って見せるためのシートにデータを取り込みます。
データ用のシートは誰かに見せるための物では無いので、集計のしやすさを優先して作成します。必ず1データを一行で表示し、セルの結合などは使いません。
データを管理する部分と、表示のための機能を分ける考え方は、モデルビューコントローラーモデルと呼ばれ、1990年前後からソフトウェアの設計に取り入れられるようになった方法です。モデルはデータを管理する部分、ビューは表示のための部分、コントローラーはモデルを操作するための部分でExcelがそれに当たります。
このようにデータと表示を分けておくと、表示を様々に変化させてもデータが影響を受けることが無いため、データを誤って書き換えてしまう心配がありません。頻繁なレイアウト変更の要求にも応えやすくなります。また同じデータを複数の方法で表示しているとき、データに変更が発生しても、複数の表示用シートに簡単に反映させることが出来ます。

小計や合計は式を入れる。
個々の値をsumで足しあわせて小計を、小計を足しあわせて合計を求めます。
当たり前のようですが、オートsumで上手く選択出来なかったり、自動の書式指定で上手く表示出来ないと、そこであきらめて数字を直接入力してしまったりする人は少なくありません。きっちり調べて式や表示書式で実現するようにします。
またsubtotalと言う関数がありますが、これは使いません。標準のドキュメントでは、subtotalは選択範囲内にある小計などの計算式を無視して合算を表示してくれるので、小計と合計が混在している表で容易に合計を求められる関数として例示されています。ですがこのような集計の方法をとっていると、小計計算式の選択範囲が誤っていても、合計は正しい値になってしまうため、小計が間違っていることに気がつき難くなります。合計は小計を足し合わせる式として書いていれば、小計が間違っているときに合計も誤った値になるので気がつきやすくなります。

合計や小計が正しいことを手早く判断する。
合計や小計が正しいことを手早く判断するには、合計や小計の計算元となっているシート全体を選択したときに右下に表示される合算が、合計の整数倍になっていることを確認します。もしどこかの指揮が誤っているなら、合計の整数倍にはならないので、各式を精査して誤っている箇所を探します。

以上のようなことに気をつけると、手早く、誤りないExcelの資料を作れます。