東京タヌキ探検隊タイトル

東京タヌキタイムズ

128号(2019年8月) データベース論

東京タヌキ探検隊!と東京コウモリ探検隊!ではデータベース・ソフトウェアはFile Makerを使っています。
ですがまず最初はデータベースの話ではなく、どういう情報を収集しているかについて説明します。

データベースに記録するために必要な情報

東京タヌキ探検隊!ホームページでは知らせてほしい情報として次のものを揚げています。

・動物名
・目撃年月日
・目撃時刻
・目撃場所(詳細に)
・目撃頭数
・行動の様子

これらは情報の確かさを示すために必要なものです。
「以前に○○の近くでタヌキみたいな動物を見かけた」というあいまいな情報ではダメなのです。「以前」とは先月のことか、去年のことか、それとも10年前のことか。「近く」とは10mか、100mか、それとも1000mか。
東京タヌキ探検隊!では目撃場所を地図にプロットしたり、年ごと、月ごとの統計をとったりしています。日時や場所の情報の精度が悪いと統計データとして利用することができず、意味のないものになってしまうのです。ですのでできるだけ正確な情報がほしいのです。

ただ、過去の情報になるとどうしてもあいまいなものになってしまうものです。
東京タヌキ探検隊!としてはデータベースに記録するために「目撃年」と「(ある程度)正確な住所(位置情報)」の2つは最低限必要であると決めています(このことは公開していません。ここで公開しちゃってますが)。

各項目を説明していきます。

・動物名

ホームページでは「必ず「タヌキ?それともハクビシン?アライグマ?」のページをご覧いただき、メールには「比較ページ見ました」と書いてください。」との注意書きを載せています。
これは初期の頃、動物の正体がわからないときにメールのやり取りがかなり長くなる傾向があるために考え出した方法です。イラストと解説を読んでいただければ、それで多くは判別できるようです。
それでもわからない場合は、その動物の形、色、行動の様子などを詳しく書いていただけると、私が答を出せる可能性が高くなります。
もし写真や動画があるのなら、それを送信していただいた方が手っ取り早いです。多少写りが悪くても、Photoshopで明るさ調整などをして判別しますので、まずは送ってみてください。

動物を判別できる方なら比較ページをわざわざ見る必要はないでしょう。ですがこちらでは目撃者がどのような方なのかはまったくわかりません。ご面倒でも「比較ページ見ました」と書いていただきますようお願いします。

動物にあまり関心がない方だと判別は少々難しいようです。夜の目撃で、遭遇の時間が短かったりするとさらに難しくなってしまいます。

なお、目撃情報の報告が2回目以降の方は「比較ページ見ました」の記入は省略してかまいません。

・目撃年月日

過去の目撃の場合、日記などで確認してみてください。
デジカメ、スマホで写真を撮っているのなら撮影の日付は正確にわかります。

・目撃時刻

タヌキなどを目撃した時に直ちに時刻を確認する、なんて人は私ぐらいのものでしょうから、これも多少あいまいになるのは避けられません。1時間以内の誤差なら十分許容できます。
時刻もデジカメ、スマホで写真を撮っていれば正確にわかります。

ちなみにスマートフォンの時計は実用上十分な精度を持っています。なぜかというと「ネットワークタイム(Network Time Protocol)」という仕組みを利用してかなり正確な時刻を取得しているからです。普通でも1秒以上の誤差はないのではないかと思われるほどです。ですから、皆さんはスマホで時刻合わせをしたことはないはずですし、その必要もないのです。

・目撃場所

場所は正確であるほどありがたいです。住所表記では十分に表せない場合はいろいろと説明してください。
目撃場所は地図データにプロットし、地域メッシュで区切って集計しますのでできるだけ正確な情報がほしいのです。

住所では場所を表しにくい場合があります。例えば原っぱのど真ん中とか、山林の中とかです。住宅地でも複数の家が同じ住所を共有しているという例が東京都23区内では少なくありません。これはまとまった土地を売って、戸建て住宅を同時に建てたりするとこのようなことになってしまいます。

Googleマップでは緯度経度(位置情報)を簡単に調べる方法があります。

・パソコンでGoogleマップを使う

・スマートフォンで「Google Maps」を使う

Googleの公式の説明は以下のページです。

https://support.google.com/maps/answer/18539

実はこの調べ方はしょっちゅう(毎年のように)細かく変わっています。上記の私の説明も完全に正しいとは限りませんのでご注意ください。だいたいの操作方法は同じなのでそれほど迷わないとは思いますが。

「35.631537, 139.745928」というような2つの小数の並びが緯度と経度を表しています。この数字列をGoogleマップ(パソコンでもスマホでも)にそのままコピペするとその場所が表示されます。試しにやってみてください。
東京タヌキ探検隊!データベースでも位置情報はこの表記で記録しています(つまり「文字列」として記録しています)。位置情報はデータベース内で地域メッシュに自動的に変換されるようになっています。そしてこの地域メッシュの番号から分布地図を半自動で作成しているのです。
わざわざ「北緯〜、東経〜」などと書き直す必要はありません。書式は決まっているのでそのままの数字列でも混同する心配はありません。

※地域メッシュ=緯度と経度を基準に、地図を四角形に区切ったもの。地球の表面は曲面なので正確には四角形ではありませんが。それぞれの四角形には固有の番号が割り当てられている。東京タヌキ探検隊!データベースでは3次メッシュコード(約1km四方)で記録しています。詳しくはネット検索してください。緯度経度からの計算方法も見つかります。

・目撃頭数

最も書き忘れが多いのがこの目撃頭数です。ほとんどの場合1頭なのですが、はっきりと書いていただくようお願いします。

データベースとは関係のないことですが、私はタヌキなどを数える時には「頭」を使います。実はタヌキなどに限らず昆虫でも鳥でもあらゆる動物で「頭」を使っています。これに違和感を持つ人が少なくないことはわかっていますが、使い方として誤っているわけではありません。タヌキは「匹」だ、と多くの人は信じていますが、どのような対象を「頭」「匹」と数えるのかの定義は実はあいまいなものです。私の場合は大小関係なくさまざまな動物を扱うので、統一された数え方を採用しているのです。
これは皆さんに強制しているわけではありませんので、目撃情報メールで「匹」を使っても私は怒ったりはしません。

・行動の様子

目撃の時の状況を書いてください。
どこにいたか(道路か民家敷地か電線か等)、どっちへ行ったか、人間を見た時の反応などといったことです。
いったいそれが何の役に立つのか、と思われるかもしれませんが、ちょっとしたことでもこちらにはすごく興味があることだったりするのです。
例えばハクビシンは樹上で果実を食べることが目撃されるのですが、いったい都会で何を食べているのかはとても重要なことです。ちなみに東京都23区でハクビシンがよく食べるのは、柿、ビワ、サクランボです。民家によく植えられているのがこれらの樹木だということがわかります。
行動の様子が動物の判別に役に立つこともあります。例えば、電線を歩いたり、塀の上を歩くのはハクビシンかアライグマです。東京都23区に限るとハクビシンの確率の方が圧倒的に高いです(生息数が大きく違う)。タヌキは高いところに登りませんので候補からは外せます(ただし確率ゼロではありません)。

他にも、イヌ、ネコと遭遇した時にお互いにどう反応するか、雨は降っていたか、など宮本隊長が注目している点は多岐にわたります。
つまらないこと、ささいなことでもこちらとしてはありがたいのです。

129号(2019年9月) データベース論(承前)

写真・動画

写真・動画を撮影しているならば、ぜひそれもメール送信してください。写真・動画があれば種類の判別が確実にできます。数が少ないアライグマ、アナグマ、キツネでは貴重な証拠になります。
また、ストリートビューと比較することで、より正確な撮影場所を確認ができる場合もあります。

目撃情報に写真・動画が添付されている割合は全体の約27%です(2019年9月現在)。
スマホの普及のおかげで割合は増えてきています。

動物がはっきりと写っていなくてもかまいません。私のこれまでの知識を元に判断できます(わからないこともありますが)。
暗く写っていてもかまいません。Photoshopで明るさなどを調整することができ、判断できることもあります。

写真にはExif情報(撮影日時やカメラの状態の情報)、GPS情報などが含まれる場合があります。これらの情報を他人に渡すことを好まない人もいるでしょうが、こちらとしては目撃情報を補完するものですのでありがたいものです。

ただ、2018年夏ごろになってから、写真データに書きこまれている情報(Exifデータ)がほとんどなくなってしまいました。この頃にEU一般データ保護規則(GDPR)が施行された影響だろうと思われます。この頃スマホのOSをアップデートした時に、OSやアプリの仕様が変更されたようです。
具体的には、メール送信時にExif情報が消されているようです。

ちなみにGPSデータはそれ以前から付属していることは少なかったです。どの段階でGPSデータが消えるのか調べたことはありませんが、「スマホの外に出た時」あるいは「写真管理アプリから外に出た時」だろうと思われます。

最近では防犯カメラやドライブレコーダーで撮影された動画も送られてくるようになりました。小さくしか映らないことが大半ですが、それでも種の判別はできます。

死体の写真も大歓迎です。
死体の写真なんて撮りたくないという人が多いだろうことはわかりますが、動物研究にとっては死体も立派な情報源になります。
まず、確実に動物の種類がわかります。
だいたい昼間に発見され、近づくこともできるので写真も鮮明になり、詳細に外見を観察することができます。
死体がグロテスクな状態になっていてもぜひ写真等をお願いします。死因を確認できるかもしれません(多くは交通事故死でしょうが)。

なぜフォームを使わないのか

フォームとは、WEB上で住所氏名などを入力させる時に表示される四角形の入力ボックスのことです。ほとんどのショッピングサイトなどで使われているもので、当たり前の技術です。
書き漏らしを防ぐため、また、データ処理の効率を考えるとフォームを使った方が望ましいのは理解しています。
しかし、東京タヌキ探検隊!ではフォームを採用していません。当初からずっと続けていると、自由記述の方が面白いのではないかと思えてくるのです。
目撃情報の文章量は人によって長短さまざまです。一瞬の目撃だと書くことが少なくなってしまうのは当然で、短くても問題はありません。長文のメールも読むのは大変ですが興味深い情報があったりするのでありがたいものです。

この自由な感じが私は好きです。 皆さんはどうでしょう。

データベースに記録されない目撃情報

前にデータベースに記録するためには「目撃年」と「(ある程度)正確な住所(位置情報)」の2つは最低限必要であると書きました。これらがそろっていないとせっかくの目撃情報も記録されずに消えてしまうことになります。
こういうことは多くはありませんが年10件ぐらいは発生しています(記録に残らないので正確に数えているわけではありません)。

特に、位置情報があいまいにならないよう気をつけていただければと思います。

メールの返信のこと

目撃情報のメールは平均して1日1件程度来ます。メールのやりとりは1往復で終わらないことも多いです。また目撃情報メールが集中して来ることもあります。メールのやりとりは意外と大変な作業です。

現実的な問題として、メールの文章をいちいち考えるというのは非効率なことです。文章を書くにも時間がかかりますので少しでも効率よくやらなければなりません。
そこで、私は定型文の例をいくつも並べたテキストファイルを用意して、それをコピペするようにしています。こちらが追加質問したいことや相談事の回答などはだいたい定型のパターンがありますのでコピペで対応できるのです。
ただし、定型にできないことも多くありますのでコピペだけで全文を書くこともありません。

私はコミュニケーション能力が高いわけではありません。パターン化することで処理速度を高めているのです。

130号(2019年10月) データベース論(承前)

データベース・アプリケーション選び

多量のデータを扱うなら専用のデータベース・アプリケーションを使えばいいのだ! というのは当たり前ですが、私の場合、最初はそうではありませんでした。
目撃情報数が少なかった初期はなんとテキストエディタで管理していました。項目(レコード)がしっかり定義されていればこれでも問題はありません。

が、数百件を超えるともはや管理不能になります。
表計算ソフトを使ってデータベースを疑似的に構築することはできますが、項目は多いし、不特定長のテキストも含まれますので見た目があまり良くなりません(1レコードが画面上にうまく収まらない)。

ですので、データベース・ソフトウェアに切り替えました。
とは言え、高価なので簡単には買えません。ちょうど2008年11月、Bento2が発売されました。これは個人向けデータベース・ソフトウェアで、なんと4800円という低価格。発売後すぐ、2008年末か2009年初頭の頃に買いました。(※宮本隊長は1990年からのMacユーザーです。)
Bento2はデータベース・ソフトウェアとしては初心者にもわかりやすいものでした。

当初は
「東京都23区・タヌキ」、「東京都23区・ハクビシン」、
「東京都23区外・タヌキ」、「東京都23区外・ハクビシン」、
「東京都外・タヌキ」、「東京都外・ハクビシン」
というように別々のデータベースに分けていました。(この頃はアライグマの目撃情報数は少なく、データベース化はしていませんでした。)
ですが、すべての動物、すべての地域をまとめて統合しても問題ないことに気付きました。統合作業は2011年3月、東日本大震災直後のことでした(Bento4発売のタイミングでもあった)。
アナグマ、キツネも対象に含めるようになったのはこの時からです。

しかし残念ながらBentoはBento4までで開発は終了となりました。そのため上位版のFile Maker Proに移行せざるを得ませんでした。2012年4月(File Maker Pro12発売時)のことです。
以後、File Makerをずっと使い続けています。

データベース・アプリケーションというとSQL系がメジャーなようですが、一般の人にはさすがに敷居が高すぎると思います。
File Makerはインストールも難しくなく、すぐに使える、個人向けにはちょうど良いアプリケーションだと思います。

データベースのデータ構造

ここからはソフトウェアの使い方の話ではなく、データベースをどのように構築しているか、どのように利用しているかを説明していきます。

まずデータ構造の話から。
東京タヌキ探検隊!データベースでは次のようなフィールドタイプ(データの種類)を使用しています。

数値
テキスト(文字列)
1/空欄(数値)
数値/空欄(数値)
日付

「1/空欄(数値)」というのは、フィールドタイプは数値で、入力するのは「1」または空欄というものです。これはつまり論理値(1/0あるいはTrue/False)と同じことなのですが、外部に書き出す時にどのように表現されるのか不安だったこと(互換性の問題)と、空欄の方が画面上ではわかりやすいこともあり、このようにしています。
「数値/空欄(数値)」は1以外の数値も許容しているものです。

数値は原則として整数しか使用しません。

フィールドの構造

フィールドとは、各データ(レコード)に含まれる項目のことです。

まず、記録としての基本情報から見ていきます。

・DBN (数値)
通し番号です。全データに固有値が割り当てられています。基本的に記録順です。

・報告年月日 (日付)
データベースに記録した日付です。より正確にはメールの受信日、報道の日付です。目撃の日付ではありません。

・記録者 (テキスト)
データベースに記録した人の名前です。今のところ私「宮本拓海」だけで、他の人の名前はありません。将来的に作業を分担したり、引き継いでもらったりすることを当初から想定していました。

・報告形態 (テキスト)
目撃情報がどのようにもたらされたかの分類です。
「メール」
「メディア」=テレビ、雑誌など。ホームページに掲載されたものでもメディア発のものはここに分類する。
「ホームページ」
「手紙」
「宮本拓海」=宮本隊長本人の直接目撃
などのようになっています。

次は目撃情報の基本情報です。
記録として最低限の要素で、「年月日」「時刻」「場所」「頭数」といったものです。

・情報提供者 (テキスト)
情報提供者の名前とメールアドレスです。
実は情報提供者は本名を名乗る必要はまったくありません。実際、無記名無署名の人の方が多いです。性別や年齢もほとんどの場合わかりません。
お名前がわからない場合、こちらからの返信は「<メールアドレス>様」という書き出しになります。
過去のメールを探す必要もあるため、少なくともメールアドレスはデータベースに記録しています。

・動物名 (テキスト)
ここに入る動物名は固定値になっており、以下の通りです。

タヌキ
ハクビシン
アライグマ
アナグマ
キツネ
ニホンイタチ
チョウセンイタチ
ジャワマングース
アカハナグマ
不明

正体がはっきりしない場合は「不明」となります。明らかにイヌでもネコでもないならば「不明」で記録することがあります。

・目撃年月日 (テキスト)
・年 (数値)
・月 (数値)
目撃年月日がテキストなのは、日付がはっきりしないことがあるからです。少し昔のことになると細かい日付までは覚えていないものですから。「x年」「x年夏」「x年10月ごろ」という表現も可能です。
数値の項目があるのは、集計を簡単にするためです。

・目撃時刻 (テキスト)
・時 (数値)
時刻は日付よりもさらにあいまいになるものです。目撃した時に時計で時刻を確認する人はまずいませんから。「x時x分ごろ」という表現も可能です。もしスマホで撮影していたなら正確な時刻がわかります。
数値での記録は0〜23の整数となります。「20時ごろ」という場合は「20」で記録します。これだと19時台も含まれることになり、それを20とするのは問題かもしれません。しかし、そこまでこだわっても正確な時刻はわからないものです。そのため一律に単純なルールとしています。

・目撃場所 (テキスト)
目撃場所を住所表記で記録します。

東京都23区では「同じ住所を複数の家が共有している」という例によく出くわします。もともと広い土地を持っていた人が切り売りして戸建て住宅が建った場合にこうなってしまうようです。正確な場所の特定ができなくなってしまうので、東京タヌキ探検隊!的にはあまり歓迎できませんが、簡単には解消できないことのようです。こういう場合は詳しく位置を教えていただきたいです。

・市町村コード (数値)
目撃場所の自治体の市町村コードです。
市町村コードは総務省が定めている、各自治体に割り振られた固有の数値です。東京都なら「13000〜13999」の範囲内になり、東京都23区なら「13101〜13123」となるなど、計算式で指定しやすく定義されています。
統計処理するには必要な項目です。

・位置情報 (テキスト)
目撃場所を緯度・経度で記録します。「35.682236, 139.766360」のようにGoogleマップで採用している記述法を使っています。Googleマップとはコピペでやりとりできるので便利です。
数値では表せませんので文字列になります。

・3次メッシュ (数値)
・2倍メッシュ (数値)
位置情報を数値に分解し、計算式を経て地域メッシュ値に変換します(自動で計算)。この計算過程では実数を使用しています。

3次メッシュは各辺が約1kmです(東京コウモリ探検隊!ではこちらを採用)。
2倍メッシュは各辺が約2kmです(東京タヌキ探検隊!ではこちらを採用。データ密度が低いので1km四方では目撃数が少なくなってしまうのです)。
数値は自動計算されるのでデータベースでは両方とも記録しています。
メッシュ値は分布地図を作成する時に使用します。

・位置誤差 (数値)
正確な位置がわからない場合でも位置情報(緯度・経度)は必ず埋めなければなりません。そうしないと分布地図が作成できないからです。
位置が正確でないことを示すためにこの「位置誤差」という項目を用意しました。単位はm。位置が正確ならここは「0」となります。位置が正確でない場合、だいたいこの範囲だろうという円を想定し、半径値を10m単位で入力します。
普通は数十m内になります。まれに1000mを超えることもありますが、そういう場合は記録しないという選択もあります。
一戸建て住宅の敷地内ならばこの数値は一律0にしています。

・頭数 (テキスト)
・頭数 (数値)
頭数は数値だけで十分だろうと思われるでしょうが、そうもいかないことがあります。例えば親子で現れたならば「成獣1頭、幼獣4頭」という風に記録したいものです。あるいは「3〜4頭」というあいまいな場合もあるでしょう。こういう例ではテキストで記録しておきたいものです。
数値での記録は単純に合計頭数あるいは最低確認頭数になります。

・生死 (数値)
これも重要な基本情報です。
生きている状態なら「1」、死亡しているなら「2」となります。
「1頭が生きていて、1頭が死んでいる」という場合は「2」となります。死亡例の方が珍しいので、そちらを優先します。

<スポンサー欄>