« 光そそがれない交付金再び | トップページ | ブックトークをやってみよう »

図書館の統計は難しい

今、ちょっと気になっているのは『貸出冊数を虚偽報告  15年間で89万冊水増しか 横芝光町立図書館の元職員』(http://www.chibanippo.co.jp/news/chiba/local_kiji.php?i=nesp1316227995)の記事。
私はもちろん部外者なので、この件に関しては憶測の域を出ませんが、15年で89万冊ですか…月平均5000冊?
というか、統計をコンスタントにいじるのはなかなか難しいと思うんですが…
というか、この記事、これだけ見た人に誤解を与えるような感じがしますけど、何とも言えないけど、なんか変だよね。

話は今の議会中のことのようですが、過去に統計の話がないかと思って、横芝光町の議会会議録を見ると、

・平成19年12月議会の会議録の記述
 4月から11月までの入館者数が17万4,239人、貸出数46万3,959冊
 ほぼ前年並み

・平成20年度12月議会の会議録の記述
 4月から10月までの開館日数が179日間、入館者数14万75人
 年間295日間開館

・平成21年度12月議会の会議録の記述
 4月から10月末入館者数14万3,359人、貸出数44万7,784冊

・平成22年度6月議会の会議録の記述
 平成21年度の総入館者数は22万3,290人、貸出数66万8,826冊

・平成22年9月議会の会議録の記述
 7月末の入館者数7万3,286人、貸出数13万8,267冊
 前年比、入館者数6%、貸出数46%減
 コンピュータ入力に誤りがあった

との記述があります。

で、記事に戻ると
09年度、つまり平成21年度の一般書と児童書を合わせると52万2千冊以上は貸出され、
10年度、平成22年度は一般書と児童書を合わせると24万3千冊以上が貸出されたってこと。

もう少し整理して記述すると、
平成19年12月、つまり、19年度は月平均6万6,280冊、2万4,891人
平成20年12月、つまり、20年度は貸出数は記述されていないけど、2万3,346人
平成21年12月、つまり、21年度は月平均7万4,630冊、2万3,893人
平成22年6月では、21年度の総計なので先ほどとの差を考えると
668,826-447,784=221,042冊なので、11月~3月は月平均3万6,840冊
223,290-143,359=79,931人なので、11月~3月は13,321人

ん?
確かに多くの図書館で7~8月を山にした利用統計グラフが出来るけど、それにしても月平均違い過ぎない?
それに、記事は一般書と児童書だから、それ以外が14万6千冊…(雑誌やAV資料とかでしょうが)

平成22年9月、つまり、22年度は月平均3万4,567冊、1万8,658人
んん?この値はさっきの数字に近いよね。

ということは平成21年の11月からは正常値って理解でOKでしょうか??

一方、Webで掲載されているのを確認すると…

それぞれ、個人貸出
合計と団体貸出を含めた合計。
平成6年度 99,369 99,369
平成7年度 309,605 309,605
平成8年度 342,493 342,493
平成9年度 405,466 405,466
平成10年度 425,402 425,402
平成11年度 422,717 422,717
平成12年度 476,577 476,577
平成13年度 487,654 487,654
平成14年度 530,007 530,007
平成15年度 564,704 564,704
平成16年度?
平成17年度?
平成18年度 558,488 638,799
平成19年度 587,357 672,209
平成20年度 609,806 730,431

ただ、平成19年度は最後にまとめがあるのですが、
この年度の集計だと588,492 673,344で1,000プラスで違う。
同様に平成20年度も606,550 727,175で3,000マイナスで違う。
なので、平成21年度の途中で統計を見失っているのですが、貸出数約67万というのは団体を含めた数かな?

前述のように私は部外者ですから、客観的にわかる感じのする部分はここまでですかねぇ…
(それに、気になったのでざっと計算したので、それこそ数値の入力ミスや計算ミスもあるだろうし。)

ただ、確か平成22年4月からカウンター業務委託(9.20.訂正)になったんですよね。
で、ここからは推測の域を出ませんが、この記事の疑問に思うことは…

1.統計の出し方が違ったんじゃないか
仮に、今まで色々と熱心だった職員がいたのに、窓口部門が(9.20.訂正)変わったからといって、46%減するでしょうか?
いや、確かにしないこともないですが、明らかにサービスが低下したとしても、それまで培ってきた図書館の利用者から見て、46%減になるほどであれば、「悪くなったねぇ」って声がかなり聞こえてきそうな感じもします。
でも、人がいなくなったのではなく、入館者数は6%減なので、今までは20冊借りていたけど、10冊しか借りなくなったというパターンが考えられること。
新刊の借りられる率はおそらくどの館であっても、高いでしょうから、新刊を買わなくなったとか、受入した資料数を見直してみると謎が解けるかもしれません。
業者任せにしないで、町民の声を聞いてみてからでも遅くはないかと…
というか、平成22年度の6月議会前に4~5月の利用統計って報告されていますよね?
委託業務をしているのなら、特に。(9.20.訂正)
その時点で気付くでしょ?21年度の統計値が変なら。

2.15年も統計を騙すのは難しいのでは?
図書館要覧とか、様々統計は取られているはずですし、突然、「これこれの統計を」といわれることも多々ありますが、その時にもばれないようにするためには、日々の貸出記録に数百冊貸出処理をしないといけない計算になります。
いくらなんでも、そんな作業はしないでしょ?
それだけやるバイトでも雇ったり、サーバでプログラムを書き加えたりしない限り、どこかでボロが出ますよね?
でないとすると、議事録の『コンピュータ入力に誤りがあった』になるのですが、例えば、貸出数の統計をシステムの帳票を添付しないでエクセルに打ち変えて起案するでしょうか?
百歩譲って起案しないとしても、館長とか教育委員会とかで会議するときに使う資料で帳票の根拠を全く示さないで、数字だけっていうのは非常にナンセンスなので、無理のない予想となると前述のようになります。

いや、それに、平成22年9月の議会での議論が今再び再燃?っていうのも疑問がありますし、「コンピュータ入力ミス」って表現がやっぱり変だなぁと。貸出統計とかをシステム帳票ではなく、どこかに毎日入力するってことかねぇ?

なんか、その職員の方(あえてそう呼びますが)のせいにして、何かを隠そうというウラがあるような可能性もありますし、ちょっと悪意のある書き方だなぁと記事を見て思いました。
だって、その方の発言とか実際の行動を見ていたら、熱入りすぎってくらい図書館業務に積極的で真剣ですもの。
知らない人が見たら、「某所の入場者数水増し疑惑のようなものか?」って思いますもの。そんなことするメリットないですし。

そもそも、貸出数が増えたら、職員増加するようなご時勢でもないでしょうし…そういう自治体だったのでしょうか?例えば貸出数5万件につきスタッフ1人増とか…
もし、それなら、私は毎日読みもしない資料を借りては返すのをスタッフ総出でやってもらうけどな(ついでに利用者にも「借りて持って帰らなくてよいですから、借りたことにしてください」って)…笑

さてさて、この話は部外者の私にとっては経緯を見守りたい記事なので、エントリーに含ませておいて、これ以上書けませんが、「図書館での統計作業って意外と奥が深かったりするんですよ。」って今日の話の本題にはもってこいだったので、取り上げさせてもらいました。

図書館は今や情報システムは欠かすことが出来ないものですが、これが統計にはちょっとやっかいなんです。
というのも、5月頃、日本図書館協会からの新年度の体制と前年度の利用統計の調査に合わせて県からも同じような調査依頼があります。
当県だけなのか、他の都道府県でも同じかどうかわかりませんが、これが微妙に違うので、毎年のことながら、苦心します。

例えば、蔵書数や貸出数で、いわゆる一般書、児童書はもちろんなんですが、雑誌は含むのか否か、AV資料は含むのか否かという資料区分による違いや、利用者は団体を含むのか相互貸借の図書館を含むのかということも少しずつ違ったりします。

また、貸出数では利用者の自治体内数なのか、全数なのかということが違ったりしますし、利用者数や登録者数も、過去1年以内の有効数かただの登録者数かで変わったりしています。

5月の調査は毎年のことなので、何も変わらなければなんとかなりますが、システムが変更になった場合や統計の取り方が変わった場合は、要注意になります。

例えば継続貸出。
システムやその設定ににもよりますが、継続貸出をすると1貸出となるものも今は少なくありません。
もちろん、同様に図書館によっては利用者が持ってきて「またこれを借りたい」と言われた時に予約などがなければ、返却処理をしてまた貸出処理をする館もありますから、整合性的にOKでしょう。
でも、「継続なんだからカウントしなくてもいいんじゃない?」って考える人もいますし、急に貸出数が増えた(減った)原因を調べたらそのせいだったってこともあるようです。

それに類似して、とあるシステムだと、Web操作の履歴や統計が取れるように、最初から独立館の如くWebというのが設定されている場合がありますが、それが意外に問題だったりします。
というのも、Web上継続貸出をすると貸出数として同じように1カウントされる上に、1件につき利用者1人分カウントアップっていう仕様らしいです。
(つまりある利用者が10冊の継続貸出をしようとしたら、貸出数10プラスに加え、利用者数もプラス10人…っておいおい。)
大抵の統計はWeb館って設置条例でもあればともかく、システム上の分け方ですから、基本的には設置されている図書館の統計となります。
が、この場合、Webでの貸出数を無視するかというと、予約数の統計には今ならWebでの予約数が入るから、やっぱり入れないといけなくて、じゃあ、複数館ある場合はどこに入れるかとか…(サーバのある中心館?)
そんな感じでやっかいだったりします。

また、統計の取り方の問題は、それだけでなく、システム設計の段階から実際には問題になることもあって、図書と雑誌の区分を分けていなかったり、AV資料を一緒くたにしたりはかわいい方で、利用者区分がすべて個人利用者扱いだったりしますから、そうなると、1件ずつ当たらないといけない羽目になることも…

他にも、大きな調査でないとしても、例えばお隣の自治体から、「どのくらいそちらを利用させてもらっているのか知りたいので、うちの利用者数と貸出数を出して」と言われても、システム上利用者の区分が自治体内&自治体外だけだったりすると、無理だったりしますし…
年齢区分を例えば10歳ずつ区切っていたら、「未就学児の統計を出して」とか、「中学生の利用統計を出して」とか言われて、これも無理です的で…(逆もある。年齢区切りを学齢にしたら、グラフを作ると19歳~22歳で区切るか以降のことを考えて20~29歳のような区分にするか…と、19歳だけどうするか…とか問題もあったりします)

いくら熟考して様々な区分を考えても、普段使うには煩雑になったり、イレギュラーな事態が発生したりします。
例えば、自治体内図書館での資料の貸し借りは基本的には回送にまわすだけで良いのですが、実際に行事などで借りておきたいときは貸出中にしなきゃいけないので、図書館名義の利用者番号を作ったりするのですが、それの貸出や予約は区分は団体?相互貸借?ってことや、未登録者の予約や登録可能ではないので登録しないけど特例で貸す人が出てきたり、カセットテープは収集しない予定なので区分は作らなかったが、郷土資料で使えそうなカセットテープをもらった時の媒体の区分だったり、紙芝居枠などの貸出管理をするための資料統計には含まれない貸出が必要になったり…
確かに熟考が足りなかったのかもしれませんが、時代が変わって電子書籍はシステム上図書扱いできるかとかなども含めて色々なことが起き得ます。

実際には、システムデフォルトの統計帳票だと必要な統計を取りにくいので、データベースから直接SQLなどで抽出しなきゃいけないことがあったりするものもあるようですし、かゆいところに手が届くような統計帳票を持つシステムはなさげですからねぇ…

統計の取り方によって、外部に出す数値がころころ違ったり、システムの設定によって、取れる統計と取れない統計が出てくるのは、統計数値を心もとないものにしている原因のいくつかですが、それに加えて、除籍作業も問題があったりします。
除籍されたというデータが残っているうちはその情報も統計情報に含まれているのですが、あまりに使わない情報を残しておくと検索時間などシステムの負荷になることもあるので、よくSEに不要情報の物理削除を薦められます。
で、物理削除すると、実は過去の統計情報もなかったことになるシステムもあったりするので、なかなか恐ろしいことになります。
例えば年度更新で数年利用しなかった人を除籍し、個人情報なので物理的にも情報を削除するとその利用者が数年前利用したことすら存在しなくなるので、数年前の統計を突然「過去10年の推移を知りたい」と言われた時など、当時と値が違うってこともあります。
(だからといって、幽霊登録者が増えに増えて、自治体人口より多くなったらそれもまたねぇ…笑)

という感じで、私も一応ずっとシステム担当ですから、統計に悩まされること多々です。
デフォルトの帳票だと、「この統計は期間指定できるけど、こっちはできない」とか、「これとこれの組み合わせの統計は抽出できない」とかよくある話で、SQLを使ってもそもそもシステムで最初からない情報は取れないですからねぇ…ほんと苦労します。
昨年度の統計ではシステム更新があったので、数値の合わない理由を探すのが一苦労でした。
多くはイレギュラー利用や新機能のせいだったのですが、それこそコピー枚数の入力場所に入館者数を入力してしまっていたり、統計を出力する前に別の人が物理削除してしまったり、利用者登録の区部を間違っていたり…という人為的なミスのせいってこともありますし、後からの修正は統計に反映されない部分とされてしまう部分の数値の整合性がつかなかったりしたためです。

ということで、日図協とシステムベンダーさんに統計について今後お願いしたいことは、次のとおり。

・毎年取る統計について、日図協の号令のもとで、システムベンダーさんにワンクリックで出力される様式化を進めてください。

そうすることによって、年度初めの忙しいときに面倒なことをしなくて済むメリットがありますし、新任シス担を無駄に悩ませないで済みます。
また、その様式の仕様が区分の目安にもなりますし、どの館からも同じ条件で抽出されるので、比較しやすいでしょう。
可能であれば、都道府県独自の統計も調べて、過去のデータと整合性を取れるようなものになるともっといいかもしれませんね。

・統計情報の帳票はありとあらゆる出力が可能なような柔軟なシステムを作ってください。

システムがブラックボックスになっていることも多々ありますが、大抵は色々とフラグはあると思いますので、それらを色々な条件で抽出できるようになると、とても楽になります。
せっかくの業務軽減のためのシステムが統計においては負担になることも多くありますし。
可能であれば、SQLに対して素人の人でもわかるように、SQL文を打たなくても、例えば「この期間のこんな条件に当てはまる利用者のこの分類の貸出数」とかプルダウンリストなどでフラグを引っ張ってこれるようにとか、わかりやすい形のプログラムが欲しいです。

まぁ、この辺は実際に各図書館員が声を上げてくれないと、私がSEさんなどに言っていても、「いやぁ~そういう声初めて聞きました」ってよく言われますし。
(やっぱり図書館におけるシステム担当者会って必要だよな…)

ということで、前段が前段だけに長くなりましたが、長くなったついでに、最後にいくつか統計にまつわる話。
・とある図書館の統計、よく見ると『自治体内利用者<自治体外利用者』になっている…広域利用のせいなのだけど、よく議会などでツッコミ入らないなぁ…って思います。提出する利用統計で全数表示とかなんだろうか?ついでのついでだけど、登録者率100%を超える値になっている理由は広域利用者なんだけど、そもそも自治体内人口で割り算するのはおかしくない?
・とある利用者(子供)、絵本を1冊借りて、館内で読んで、返すついでにまた借りるを何回も繰り返していたので後でその日の統計を確認したら、年齢別利用者数に偏りが…笑
・とある図書館のレファレンス統計、前年度比数百%ってどれだけ多くなったんだ?って思って聞いたら、レファレンスの定義を改めたってことに加えて、何か問い合わせがあったらカウンターの紙に正の字を書くようにしたんだと。確かに簡単なレファレンスや問い合わせだと記録するの忘れるからなぁ…
・自館での話。所蔵資料の絵本の作者の統計を取ったら、圧倒的に五味太郎さん!そんなに偏って買っているつもりはないけどなぁ…絵本扱いの資料として元々多作な五味さんのが多いってことだけなのかな?(この統計、レオ・レオニとレオ=レオニとか漢字氏名とかな氏名の著者の整合性をするための直しが面倒でした。)

それにしても、システムから出るある統計値、時々原因不明な増減あるんだけど、SEさんに聞いても「う~ん?」で解決しないのはもやもやだなぁ…

|

« 光そそがれない交付金再び | トップページ | ブックトークをやってみよう »

雑多なつぶやき」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« 光そそがれない交付金再び | トップページ | ブックトークをやってみよう »