skip to Main Content

音声SNS「Clubhouse」はTwitter登場時に似てるが、Twitterとは全く異なる

Coral Insightsをお読みの皆さまであれば、もう「Clubhouse」と目にするのはウンザリしているかもしれません。あるいは人によっては引き続き興奮気味に「これはすごい」というかもしれません。いずれにしても過去1週間ほどで日本のネット界でのClubhouseの話題性は、近年なかったタイプのものだと思います。

私もご多分に漏れず、ここ数日はかなりClubhouseで、あちこちのルームをのぞいたり、自分で喋ってみたりもしています。それで感じるのはTwitterが2007年4月の特定の1〜2週間という短期間に日本のネット界隈の人たちがこぞって参加しはじめた頃の空気感に似ているなということです。ClubhouseとTwitterは、音声とテキストという違いはもちろんありますが、現実世界にあるソーシャルグラフ(人と人のつながり)を上手にすくい取って、それまでオフラインにしかなかった種類のコミュニケーションを発生させたという点で似ています。

この記事では、ClubhouseとTwitterやZoomなど既存のコミュニケーションプラットフォームとの違いを軸に、使ってみて気付いたことや可能性についてまとめてみたいと思います。記事を読まれる方で、まだClubhouseが何かご存じない方のために、どんなアプリか箇条書きにすると、以下のとおりです。

  • ユーザーが自由に「ルーム」を作り、そこで複数人が音声で会話するアプリ
  • 動画やテキストがなくアーカイブも残らない
  • リアクションの顔アイコンや投げ銭、チャット、DMなどもなく、スピーカーは声以外に気を配る要素がない
  • ルーム参加者にはモデレーター、スピーカー、リスナーの区別がある
  • リスナーは発言ができない。何か言いたいときは挙手してモデレーターが許可を与える
  • ルームは2、3人の井戸端会議であることも、数百〜数千人のセッションであることもある
  • ユーザーはフォロー・フォロワーで関係で繋がっている
  • ルームは誰でも参加できる「オープン」のほか、フォロー対象だけ参加できる「ソーシャル」、明示的に招き入れた人だけがいる「クローズド」がある
  • オープンのルームには通知経由(友人の誰それが何に付いて話していますなど)や、ルームタイトル名などを見て、ふらっと誰でも入ってくる
  • フォロー対象がルームを始めると通知が来るほか、ユーザーが興味のありそうなルームタイトルや参加者の場合にも通知が来る
  • iOS上、アプリ上ともに頻繁に通知が来ることで、どこで誰が何を話しているかが分かり、思わず気になってクリックすると、即座にルームに入れる
  • 自分に近いユーザーがどのルームにいるか、何をしているか、現在オンラインかなどはユーザー一覧から分かり、すぐに呼ぶこともできる
  • 上記の機能の複合により、常に人がわさわさと参加していて、あっちのルームに行ったり、こっちのルームに行ったりするプラットフォームとなっている
  • 音声のみという制限から逆に、歩きながら、買い物しながら、お風呂に入りながら、簡単な作業をしながらスピーカーとして参加する人もいる
  • モデレーターが存在するなど、各種機能から自然と促進されるコミュニケーションスタイルはあるものの、まだ初期フェーズで、企業内のブレストを外部の人を交えてやるなど実験的なユースケースも出てきている

これは単なるFOMOではないのか?

まずはじめに、今回のハイプとも思える話題性に関連する話として、「これは単なるFOMOではないのか?」という点に触れたいと思います。FOMOは「Fear Of Missing Out」の略で、自分だけ話題や流行、チャンスに乗り遅れることを恐れるという集団心理のことです。米国のスタートアップ投資の世界では、トップティアのVCが投資した会社は、あたかも成功が運命づけられたかのように、実力以上に評価されたり(誰もが投資したがりバリュエーションが高騰)、後付け的にプロダクトやマーケティングの素晴らしさを、こぞって褒めそやすという傾向があります。

今回のClubhouseも、そんな1社に見えます。特に、すでに音声系アプリが日米ともにたくさん存在していたことを思うと、突然のブームに過熱感を抱くのは自然なことだと思います。

著名VCのAndreessen Horowitzが2020年5月に1億ドル(約100億円)のバリュエーションで出資したとき、まだユーザー数は、わずか1,500人。同じくAndreessen Horowitzがリードを取る形で、わずか9か月後の2021年1月24日にシリーズBの追加投資を実行。なんと10億ドル(約1,000億円)のバリュエーションに達したとFortuneなどが報じています。まだ収益化前、かつ完全招待制である、ベータ版とも言える状態であるのにユニコーン企業となっています。

いったい何が起こっていて、何がそんなに凄いのだろうかと興味を掻き立てるのに十分な動きです。Clubhouseは招待制として入ってくる新メンバーの数と質をうまくコントロールすることでプレミアム感を出す初期マーケティングに成功しているのは明らかです。自分はテック産業のインサイダーだと自認する人であれば、これだけの騒ぎであるのに招待を受けていなくて実際に使ってみることができないという状態が、まさにFOMOの心理を生み出すことになっています。米国でも日本でも招待枠をネット上で売買することまで起こっていて、相場は米国で25ドル(約2,500円)、日本では1〜3万円でした。もちろんこれは規約違反でアカウント削除の対象となりますが。

しかし常識的に考えて、FOMOを生み出すためだけに、VCが桁違いの大型投資などするわけがありません。例えばこれが20社のVCがレイターステージで投資するというのであれば違いますが、ほとんどAndreessen Horiwitzが単独で投資ラウンドをリードしていることから、明らかに、彼らは音声SNSの未来で大きな賭けに出ています。その勝者をClubhouseにするぞという関係者の強い集合意思が働き始めているように見えます。

ネットワーク効果の働くサービスは、1社独占が起こりやすいものです。Twitter登場後には雨後の筍のように似たようなサービスが登場しましたが、残ったのは1社です。いったんどこかにユーザーが集まり始めると、そのユーザー(友人や趣味の仲間、業界の知人など)の存在自体が価値になるので、その上昇スパイラルに他のサービスは勝ち目がなくなります。多少の機能差や使い勝手の違いではひっくり返せませんし、場合によっては先行する類似サービスまで飲み込むことがあるように思います。例えば、日本国内でもTwitter登場時には、ユースケースとしてはTwitter(あるいはLINE)と似ていた「リアル」と呼ばれた日本独自のケータイ向けサイトがたくさんありましたが、その同時多発的に生まれたサービスや文化は、残念ながらTwitterに飲み込まれて行ったのでした。

こうして私のような立場の人間が日本語で記事を書くたびに、「なになに? ここがパーティー会場なの? 何か面白いことが起こってるの?」と続々と人が集まってくるというサイクルが生まれます。ここ数日、Clubhouseはまさにパーティー状態です。数百人が集まるルームが生まれる一方で、通路で数人が集まって立ち話するようなルームも生まれています。そういうものに惹かれる新しいもの好きの人たちは面白がって実験的な使い方をしていますし、逆に大人数のパーティーが苦手という人は、何が面白いのかわからないし、むしろ居心地が悪いという感じで去って行くか、少人数のルームを作って気の置けない仲間と話をしていたりします。

水飲み場のコミュニケーションがオンラインで再現

Clubhouseの急速な立ち上がりにはコロナ禍によるリモートワークも大きく影響していると思います。ZoomやSlack、Twitterとは全く異なるコミュニケーションに「久しぶりに社外の人とお話した気がします」と多くの人が嬉しそうに感慨をもらしていました。私も「西村がコーヒーを淹れる10分だけ開いているルーム」として、実際にお昼頃に自宅でコーヒー豆をひきながら雑談をしていたら、次々と友人や知人、業界の仲間がやってきました。少し話をして「じゃあ、これから大事な交渉の打ち合わせなので、また!」と、順番に参加してくれた人が数分おきに去っていくということになりました。オフィスなら通路やパントリーで発生するような、すれ違いざまの偶発的な会話が、はじめてオンラインで再現されたように思えます。私を介して「はじめまして」と挨拶するケースがあって、ああ、もともと業界の緩やかなコミュニティーや紐帯というのは、こうやって維持されていたのだったと思い出しました。さらに、国際核融合実験炉「ITER」プロジェクトの方とつながったことで、現在Coral Insightsで企画中だった核融合関連のインタビュー記事への協力をその場でお願いして快諾いただくということにもなりました。こうして偶発的に人と交わる中で企画やアイデアが生まれるのだということを改めて思い出すできごとです。

リアルな場と違って、向こうからこちらが発見されやすすぎる結果、10分で閉じる予定だったルームは1時間あけっぱなしとなり、次々と人が入ってきましたが、その結果、数年ぶりに久闊を叙するようなことが次々に起こりました。

比べてしまうとTwitterは少し殺伐とすることが多くなっているように思います。テキストと違って音声(や動画)は情報量が豊富で「ソーシャルキュー」と呼ばれる聞き手や話し手の内面を反映した表情や声音の変化などが伝わりやすいメディアです。ですから、テキストベースのやり取りよりも感情的な行き違いが起こりづらいこともあるのではないでしょうか。

情報の出ていく範囲が限定されているか、いないか

これは不思議なことで、私が話をしたのは、TwitterやFacebook上でも互いに近況も知っているのに、直接言葉をかわさないままだったか、ほんの少しメッセが往復した程度だった関係性です。ほんの数分あれば、親密さの距離感や、互いのアップデート、業界のトレンドや最新情報の共有ができるのに、それをやる方法がごっそりとリモートワークで抜け落ちていたように思います。それはTwitterがあくまでもパブリックな場なので、誰が見ているか分からない場で気軽に発言しづらい、ということが大きいのだと思います。

Clubhouseは会話の内容を発言者の事前許可なく録音したり、文字にして公開することが禁じられています。Clubhouse自身もアーカイブを残さないと明言しています。

もちろん録音は技術的にできてしまうので、今後、揉め事や場合によっては訴訟などもあり得るかもしれません。しかし、どの程度の範囲に自分の声が聞こえているのか分かった状態で話すということが可能で、これはリアルな社会同様に重要な意味を持っていると思います。人間の会話が届く範囲は数メートルから最大でも20、30メートルでしょうか。私たちは声が聞こえている範囲、そこにいる人を意識して、話す内容を変えているはずです。だからこそ、リアルイベントのパネルセッションでは、より本音が出てきて面白いということになるのではないでしょうか。さらに小さな3メートルの立ち話では聴衆の前で言えないことも話せるものです。話が届く範囲に応じて、さまざまな種類のコミュニケーションをやってきたのが人間社会だと思うのです。

Facebookはある時期、きわめて粒度の高い可視性の調整を可能にしたことがあります。GoogleがFacebookに対抗して出したSNSのGoogle+でもそうでしたが、誰と誰の目(耳)に入る可能性があるかを1人1人のレベルでコントロールができました。私は当時これこそ必要な機能だと思ったのですが、この2つは失敗に終わっています。Google+でいえば、投稿の見える範囲を決める「circle」を作って、そこにユーザーアイコンをどんどん足して行くのですが、とてもではないですが、そこに作成・維持の手間をかけていられなかったのです。その結果、Facebookでは「公開」「友人のみ」あたりの2つに落ち着いたように思います。現実社会では、こうした可視性のコントロールは物理的な距離や部屋の壁の存在、そして視覚による確認によってダイナミックにやっていて、今までそうしたことが自然にできるネット上の場は多くなかったように思います。

Clubhouseで人が集まってくる場は、かなりオープンな感じになっていますが、それでも声が届く範囲は限られています。そして今まさに届いている範囲は目で見れば分かるというところが、今までになかった安心感と、比較的自由な発言に繋がっているよう思います。大人数が集まるルーム内では、最上部にモデレーターとスピーカーが順に横3つのサイズで並び、その下で聞いているリスナーたちは少し小さい横4つサイズで並びます。そして最上部(本物の部屋で言えば「最前列」でしょうか)に表示されているリスナーというのはスピーカーの誰かと繋がっている人たちです。このことによって、スピーカーから見ると、自分の知っている人たちが聞いていて、そのさらに向こう側に、たまたま立ち寄った人たちがいるように見えます。数百人ともなるとスクロールしても誰がいるかもう良く分かりません。これは私にはイベント登壇時に暗い会場で観衆の顔が見えない状態にそっくりに感じられます。こうしたデザインも発言の気楽さに貢献していると思います。

今までもプライベートや、半プライベートな場を成立させるアプローチはいくらでもあったと思います。Clubhouseは、特別に誰と誰と選ぶというより「ほどよくプライベート」の状態が常にあちこちに出来ていて、流動的なのが良いなと個人的には思います。

Zoom会議と違って「同時発言」で笑い合える場

Clubhouseを使って複数人で話をしていて気づくのは、Zoomと違って2人とか3人、場合によっては4人くらいの声がかぶるのを許容している点です。これは発話中の人のアイコンの光り方を見ても確認できます。Clubhouseでは実際に声が出ているときだけ枠が光り、しかも声に合わせて明滅していて発言の音量が語尾で小さくなると、消え入る前のろうそくの炎のようにゆらゆらっと消えていきます。一方、Zoomはファシリテーションを前提とした会議がモデルなのだと思いますが、1度に光る枠は1つだけ。しかも、1度光るとしばらくはそれが消えません。明示的に発言者を切り替えるのが、建設的な議論には重要だということなのだと思います。

ZoomでもClubhouseでも、特にワイヤレスヘッドホンを使っていると音声の遅延のせいで発話がぶつかることが起こります。「あっ、すみません、どうぞ」と譲り合うことはリアルな会話と同様に起こりますが、その頻度やぎこちなさという点で、Clubhouseのほうがリアルに近いように思います。数人で雑談的に話すときのストレスがClubhouseのほうがずっと小さいのです。

また、リアクションボタンがないため、相づちや、軽い笑いを積極的に音声で表現することになる、ということもあります。Clubhouseでも喋らないときは上手にミュートボタンを使いましょうと推奨していますが、恐らくそれは10人ぐらいがスピーカーであるパネルディスカッション形式や、背後の踏切の音がうるさいようなケースを想定してのことではないかと思います。

個人差は大きいですが、リスナーとして大きく頷きながら聞くとか、同意や理解できないことがあれば首をかしげるとか、そうしたフィードバックを積極的に行うことは発話者に対するサービスだと思います。Clubhouseでも、「あれ? みんな聞いてるかな?」と発言者が不安にならないよう、特にモデレーターのときには適宜うるさくならないように相づちなどのリアクションを聞こえるように入れるのが良いように思います。Clubhouseは、それを許容する通信方式になっています。

1:nのメディア型か、n:nのコミュニティー型か

Twitterは参加者全員が機能的にはフラットです。トランプ前大統領でも私でもできることは何も変わりません。これは参加者が全て対称的にn:nで繋がったコミュニティー型のプラットフォームということです。ただ、実際にはTwitter上のユーザーのフォロワー数の分布は下図のようになっていることが知られていて、大きな非対称が存在しています。図から分かるのはTwitterユーザーの目に触れる大半のツイートは、ごく一部のユーザーのツイートだということです。

ロングテールで小さな仲良しグループをたくさん形成するタイプのプラットフォームもあると思いますし、Twitterは鍵アカウントがあることから、明らかにそうした利用も想定して内包しています。しかし、Twitterは機能的にはn:nのフラットな場に見えて、実態としては1:nのメディア型に近いのではないでしょうか。

Clubhouseでも両者を内包しつつも、最初から1:nのメディア型を指向しているように見えます。実際に、数人の専門家やインフルエンサーが数百人の前で話をしている、ということが起こっていて、これは初期Twitterとは全く違っています。Clubhouseの公式ブログでも良いモデレーションのやり方が書かれています。さらに、コンテンツのクリエイターに還元する計画をしていることから、やはり最初からメディア型を指向しているように見えます。Spotifyが人気ポッドキャスト・ホストを多額の資金で囲いつつあるのとも似ているかもしれません。そうしたこともあってか、日本でもラジオ局やテレビ局、出版社の方々が日本のClubhouseの様子をたくさん見に来ていたり、すでにロンブーの淳さんが来て2,000人ほど集めるなど、芸能人、スポーツ選手もちらほら集まっています。これも、Twitter初期とは全く違うように思います。本国アメリカの中規模なルームではビジネス系のナレッジシェアや、特定の職能集団が議論をしていたりするケースも多くみられます。

ただ、Clubhouse創業者のBen Rubin氏はユースケースについて、まだユーザーが勝手に試行錯誤して色々出てきている段階で、それを見ているのは最高に面白いとTwitter上で発言していますから、明確に特定のモデルを想定して設計しているというよりも、初期Twitterもそうであったようにユースケースに対して機能改善を続けていくことになるのでしょう。例えば初期Twitterにはメンション機能がありませんでした。ユーザーが勝手に「@」を発明して、それをTwitterが後追いで機能として実装したものでした。同様に、Clubhouseは去年10月にルームが人種差別やヘイトスピーチで溢れた場合に対処できるようモデレーター機能を拡充したりしています。あるいは、今のところルームには終了時間が設定できませんが、あまりに雑談を延長してしまいがちになることから、ルーム開設時に終了時間をシステム的に設定できるようにしてほしいというリクエスがClubhouseに届いているようです。

今のところ日本語圏のClubhouseにはスタートアップ系の人が多く、私が繋がっているのも、そうした人々が中心だったため、ここ数日はまるで毎日スタートアップイベントをやっているような雰囲気すら感じています。200〜500人が数人の話を聞く「パネル・セッション」と、そこから敢えて外に出て、数人〜十数人で雑談をする「通路の立ち話」というのがうまく混ざっています。果たして後者だけのために人々がClubhouseに来るかは疑問かもしれません。そこはリアルイベントと同じです。セッショントークよりもイベント会場の通路やイベント後の交流会、飲み会が楽しいという人はいますが、それでもメインのトークがあるからこそ一定の集客力となっているのではないでしょうか。こうしたことを考えると、Clubhouseはイベントテックにも分類できるアプリなのかもしれません。

リアルイベントやパーティーや立ち話同様に、気軽に参加して、気軽に立ち去れるというのも、Clubhouseの面白いところです。ルームを出るときのボタンが「leave quitely」(黙ってしずかに退出)となっていて、単に出る(leave)だけじゃなく、何も言わずに出てもいいんだよということを文化として醸成しようとしているように見えます。これは重要なことで、実際にスピーカーもリスナーも気がついたらいなくなっている、ということが頻繁に起こっています。退出の心理的ハードルを下げることが、逆に「気軽に入る」ことを許しているのだと思います。Zoomで6時から8時まで集まって話しますと言われて入ってしまったら、何も言わずに出るというのは普通はできないと思います。

「何が凄いのか分からない」と言われるのは共通

米国でも日本でも音声系サービスは過去数年で多数出てきていますから、Clubhouseの何がそんなに違っていて、何がそんなに凄いのか分からないという指摘もたくさん耳にします。「単なるFOMOではないのか?」という意見については、すでに触れました。違うのは金額感ということもあるかもしれません。さらに、上に書いた1つ1つのことについても、「その点については、○○○がある」という反論もあると思いますし、それは正しいのだと思います。ただ、プロダクトは機能やデザインについての無数の意思決定で成り立っていて、その結果としての機能の集合体がコミュニティーの性質を決めるのは間違いありません。そのとき、何が正解で誰が勝者になるのか、そもそも音声SNSで勝者が出てくる領域であるのかは数年後に振り返らないと分かりません。FOMOやハイプの要素があるにせよ、私を含めて、今ここで新しい有力な音声SNSが立ち上がるのかもしれないと多くの人が感じているのは事実ですし、そのことが自己実現的な力を持つ可能性も高いのではないかと思います。

「シードVC: Coral Insights bar」のルームを今夜、開きます!

本日金曜(2020年1月29日)の夜9時半からClubhouse上で以下のルームを開きます。ぜひクリックして予約しておいてください。皆さまのお越しをお待ちしております!

https://www.joinclubhouse.com/event/exBJ314x

Clubhouse
西村 賢

西村 賢

Partner, Chief Editor @ Coral Capital

Coral Insightsに登録しませんか?

Coral Insightsのメーリングリストにご登録いただくと、Coral Capitalメンバーによる国内外のスタートアップ業界の最新動向に関するブログや、特別イベントの情報等について、定期的にお送りさせていただきます。ぜひ、ご登録ください!

Related Articles

カテゴリー

New call-to-action
Back To Top