概要

OpenStack Summit が521日から24日までバンクーバーコンベンションセンターで開催された。

3年前の同時期にも同じ場所で Summit があり、その時は主催者発表で 6,000人以上の参加者があった。今回はスポンサーブースの床面積が前回の半分であり、初日のキーノートが行われた部屋の定員が 3,000人強だったので、参加者は前回の約半分とみてよいのではないかと思う。

 

他と比較しなければ十分大規模なイベントなのだが、だいぶ落ちついてきたなと感じた。また、全員参加のキーノートセッションは、前回のシドニーと同様に初日の午前だけで、かわりに Edge computing OpenDev の参加者が小規模なキーノートがあり、関心の対象がばらけてきているという印象を受けた。

キーノート

「初めて参加する人は?」という恒例の質問に2割くらいが手を挙げていた。上に書いたように参加者は減ったものの、新しい人もそれなりに入ってきているようである。

CERN  の登壇者が行った最初のデモは、GKE や OpenStack など、様々なクラウド上で Kubernetes を動かして連携させていた。”Open infrastructure” が今回のキーワードで、どうも OpenStack 上で Kubernetes を動かすことを指しているようだが、具体的にどういうものかははっきりしなかった。

Edge computing の話が Ildiko Vancsa 氏からあり、Edge の定義はホワイトペーパーにようやくまとまり、これから Hype Cycle に入るのだと話していた。Edge 関連のセッションが 40 以上あると告知していた。

OpenLab (https://openlabtesting.org) の紹介もあった。OpenStack およびその上のレイヤ (Kubernetesなど) の (パブリックやハイブリッド) クラウド間の相互運用性テストをやるというもので、デモでは、OpenStack 上の Kubernetes クラスタでボリュームとロードバランサを作成していた。

OpenDev CI/CD

タイトルからわかるように、CI/CD の話を集中的にやる会議で、元々 OpenStack CI ツールとして開発された Zuul の話題も含まれるものの、CD ツールとして宣伝されていた Spinnaker  Kubernetes を強く意識しており、OpenStack から派生してちょっと別の話題をやる会議といった感じであった。これには OpenStack Summit のパスがあれば参加できるが、OpenDev 専用のチケットで参加している人も結構見受けられた。

会場を見回したところ、このキーノートにはおよそ 300 人弱参加しているようである。最初に OpenStack Foundation の Jonathan Bryce 氏から OpenDev イベントの説明があった。去年秋にもサンフランシスコで OpenDev のイベントがあったようだ。今日も明日も参加者のパーティが用意されていて、プロモーション費用がかけられているのかな? と感じた。Jonathan 氏が、何故 CD (continuous delivery) が必要か?といった抽象的な話をしていて、この様な場で話を盛るのはありがちではあるが、”move humanity forward faster” などと言って CD が人類を救うみたいな話にしてしまうのはちょっとやりすぎだと感じた。

続いて OPNFV と OpenDaylight の登壇者が、彼らのプロジェクトにおいての CI/CD について説明した。依存関係が複雑だから CI/CD がないとやってられないといった話であった。OPNFV cross community CI (XCI) というものがあって、OPNFV の Upstream プロジェクト (OpenStack, ODL, FD.io 等) の Git の最新バージョンを定期的にもってきて CI を動かして動作を確認するということを行っていると解説していた。

次に Mirantis の担当者が、「なぜ OpenStack の人達は Spinnaker を気にしないといけないか」という題で話をした。Spinnaker の説明をするかと思いきや、アプリケーション開発者とインフラの人のギャップ (気にしているものがどう違うか) を話し出した。インフラの人は stack で考えるけどアプリの人は pipeline で考えるとか言っていた。Spinnaker は OpenStack のように Pluggable で、Spinnaker は Cloud Native CD だそうである。

他には Mesosphere の担当者が Microservice CI/CD の話をしていた。

Edge Keynote

参加者はわりと大勢いて、Edge への関心の高さをうかがわせる。Ildiko 氏が挨拶した後、99Cloud の担当者が登壇した。Edge computing について抽象的な話をしていると思っていたら、織機の話になった。Edge cloud に Central cloud からコードを送りこんで検査をするといったことを話していた。木曜午後のセッションで詳しく話すと締めくくった。

次は、AT&T と Intel による Akraino プロジェクトの紹介であった。Edge はレイテンシが少ないとか、5G (Infra) は Edge だとか言っていた。どうも彼等にとって Edge とは 5G の基地局のことのようである。プロジェクトの参加企業の一覧もでていたが、過半が中国企業で残りがアメリカ企業であった。

スポンサーブース

Tencent Cloud がブースを出していたので話を聞いてみたところ、世界で商売してる会社が中国にもビジネスを展開したくなったケースをターゲットにしてるとのことであった。中国だけじゃなくて世界中にパブリッククラウド を持っているそうである。

Supermicro は 2Uラックサイズで 2.5インチの NVMe SSD がたくさん挿さるサーバなどを展示していた。U.2 コネクタとかいうものでわりと最近でた規格のようである。コネクタ形状がちがうので HDD は挿さらない (HDDが挿さる製品は既に別にあるから) とのことだった。

その他のセッション

Integrating OpenStack with DPDK for High Performance Applications

NTTの小川さんと中村さんによる networking-spp の話である。立ち見が出るほどの盛況ぶりだった。

CPU を pin してパケットフォワーディング性能を 2-3倍にしましたといった話だった。また、Rocky では NUMA aware にしようとしているとのことだった。会場からは、パケット転送は速くなったが実際のアプリケーションの性能はどうなのか?というコメントがあった。

 

Moving from CellsV1 to CellsV2 at CERN

CERN が Cells を v1 からv2 に移行した話である。CERN について、LHC の写真を出したりしていつもの紹介から始まった。
Newton で Cell を 70個使っていたそうである。まず Ocata に移行してから、Pike を飛ばして Queens にアップグレードしたとのこと。

Cells v2 に移行することで、ローカルの cellsv1 patch を捨てられるが、誰も使っていないのではないかという疑惑があった事や、スケジューリングで足りない機能 (dedicated cells ができないとか) がいくつかあった事から、Rocky に入っているものを Queens に backport して使っているそうである。また、v2 だと Cell/DB が落ちるとクラウド全体に影響があるが、今までの運用で DB はあまり困ってなかったので大丈夫だろうと思ったなどと話していた。移行作業では、一度クラウドを止めてからアップグレードしたそうだ。

移行後は API と Placement の CPU usage が増えたので、association_refresh を configurable にして長くしたが、それでも Ironic では問題になると話していた。他に、DB負荷が増えた事や、Nova list 等を Optimize するパッチを出した事など、いくつか問題はあるが Cells v2 に移行できたという結論であった。

 

How to achieve strong isolation by PouchContainer

Alibaba で使っているコンテナ技術の話である。オープンソースになっているそうだ。(https://github.com/alibaba/pouch)

もともと自前で作り込んでいたアイソレーション技術だが、後に LXC を使うようにしたりして、現在は Docker Image を使えるようになっているという説明があった。

レガシーエンタープライズアプリケーションのために、2.6 カーネルで動かさないといけない等のレガシー互換性が必要になるため、Kata Containers を導入したそうである。9pfs を 2.6カーネルに backport したり namespace の分割をなくしたりと手をいれる必要があったと言っていた。デモをして `uname -a` を実行して実際に動くことを示していた。発表者が前日に Kata Containers の担当者と話して、こういう需要があると分かってもらえたとのことだ。

他に、 LXCFS で resource view isolation を行って JVM が heap を食い潰さないようにするとか、disk quota もあるよといった話をしていた。PouchContainer はレガシーエンタープライズ用の Fast Container だとまとめていた。

 

Tencent TStack’s Roadmap with OpenStack

中国 Tencent で使っているクラウドは Tstack という名前で、2012 年から OpenStack を使っているそうだ。スライドに中文がまざっていて、Cloud Platform は雲平台と書くようだ。

複雑になってきたので Open Reference Platform が必要になったため、OpenStack を使うようにしたと言っていた。Tencent は世界最大の インターネット企業で、PaaS も SaaS も大規模に展開していると語っていた (スライドには顔認識とか WeChatPay とか Enterprise WeChat も当然ながら入っていた)。

2015年からオンプレミスでも提供している。パブリッククラウドは 14クラスタあるとか、Web UI は OpenStack のは使いにくく他のクラウドもサポートしないといけないので独自のものを使っていると言っていた。

他に以下のようなことを話していた。

  • Monitoring を作り込んでいる
  • Networking: Software SDN も Hardware SDN もサポートしている
  • Commercial Paas と統合できる
  • Microservice based TStack Paas
  • TDSQL (Tencent Distributed SQL) というデータベースがあって、99% の金融ソリューションで使っている
  • Worker Bee という社内用の GitHub の様なものがある
  • Heterogenous Cloud Management
  • Hybrid Cloud を作って L2 レベルで (VPNで?) 接続できている

次に Delivery の話があって、Ansible でやっているとか、レガシーのお客様に対して、まず客先にオンプレミスのクラウドを導入してからパブリッククラウドに誘導するといった導入フローができていて、それをやるチームを Professional Project Landing Team と呼んでいた。事例としては、政府や広州スパコンセンターがあるそうだ。

質疑応答では、Upstream はやってるのかという質問に、Pike からやると答えていた。また、内部のパッチのリベースはどれくらい大変だったか聞かれて、Pike にリベースするのに8ヶ月かかったとのことである。規模については、オペレータが200人だと答えていた。

 

OpenStack Passport Program – feedback and next step

シドニーで発表された OpenStack Passport プログラムについて、このプロモーションプログラムでどうやってお客さん集めようかといった話をしている。参加人数は少ない。以下のような話題が出ていた。

  •  Blockchain でトークン管理できないかな
  • どこから来た客か把握したい
  • AWS を利用している顧客に OpenStack を試してもらいたい

Forum

Design Summit が PTG (Project Team Gathering) に分離されて別イベントとして行われるようになってから、OpenStack Summit での技術的な議論の場は Forum と呼ばれるようになった。 Forum に参加するのは初めてだったが、規模が以前の Design Summit より小さいという以外は同じような雰囲気であった。

 

Standalone Cinder Introduction

タイトルの通り Nova や Keystone 等を使わず Cinder だけを使うという話題である。Docker とか Kubernetes といったコンテナ環境のストレージに Cinder をそのまま使えるようにしたいという動機である。似たものとして CSI プラグインがあるが、それはOpenStack 環境上で動かすものなので、この Standalone Cinder とは異なる。Attachment をどうするかといった問題があるようだ。

 

Cyborg/FPGA Support for Cloud/NFV

Cyborg というのはアクセラレータ一般 (GPU や FPGA など) を扱うもので、わりと最近始まったプロジェクトである。アクティブな開発者は 1桁だそうだが、50人くらい集まっていた。

FPGA をサポートするにあたって、VM を動かすユーザに FPGA のプログラミングを許すのかどうかといった話をしていた。OpenStack はマルチテナントなのでセキュリティが問題になりそうだが、FPGA にそれをサポートするような機能はあるのかなあと思いながら聞いていた。この FPGA ボードではどうだとか込み入った話をしていた。

 

Pre-empible instances

AWS と GCP には spot market や preemptible VM というものがあり、計算機資源が余っているときに安く使えるがクラウド側の都合で VM をシャットダウンされるかもしれないという物だそうだ。OpenStack にも同様のものがほしいという話で、CERN の Tim Bell 氏が司会をしていた。

Quota として割り当て済みだけど使っていない資源を一時的に使えるようにすることでクラウドの利用率を上げたいといった動機があるようだ。プロトタイプを作って仕様を確定しようとしている段階のようで、VM には ACPI shutdown で通知するつもりだとか、Quota の扱いをどうしようかとか、止める VM はどうやって選ぶかといった論点があるようだった。

 

Ryu

Neutron のデフォルトインストールでは OVS が使われており、Ryu を使って OVS を操作するようになっているため、Ryu は Neutron にとって重要なライブラリである。

Ryu の将来のメンテナンス状況が不明なので、OpenStack (Neutron) 側でメンテナンスするなどの対策を考えようというセッションで、私にとって今回のメインイベントであった。

他の案 (Ryu に OpenStack からメンテナンスチームを送りこむとか) もいくつか出たものの、Neutron PTL の Miguel 氏が Ryu のメンテナンスを自分でやりたいということで、まずはその方向でやってみることになった。プロジェクトの作成等については Miguel 氏が OpenStack Foundation と調整することになり、また、コード量が多いので OpenStack で使わない分を削るかどうか
といった細かいことは今後議論することになった。

 

Extended Maintenance

OpenStack の各リリースは今まで 18 ヶ月メンテナンスされた後、EOL タグが打たれブランチを削除していたが、もっと長い期間メンテナンスするべきだという話題はもう何年も議論していた。前回のサミットと PTG の議論で、ついにメンテナンス期間の延長が行われるようになった (https://review.openstack.org/#/c/552733/) そうで、その話題が今回も2コマあった。参加者は大勢いて大きな部屋で開催された。

これには短時間しか参加できなかったが、延長メンテナンスブランチからのアップグレードが確実にできるようにしたいといった話がされていた。

 

[neutron-fwaas] firewall l7 fitlering

参加者は 20 人くらいで、思ったより多い印象だったが、以前の Design Summit で大人数でわいわい議論した (結局なにも物にはならなかった) のに比べると寂しい感じである。司会も、昔議論になったんだけどねとはコメントしていた。

とりあえず対象として考えてるのは HTTP だけだそうであるが、最近はみんな https だよね、と会場からコメントがあった。

eBPF を使ってフィルターしたいとか、ユースケースを探ってる段階だと話していた。会場からは FWaaS を使うのは諦めて Virtual Appliance 側でやったという事例の話もあった。

 

S release goals

各リリースには OpenStack 全プロジェクトで共通の目標 (ゴール) がいくつか設定されている 。
参照: https://governance.openstack.org/tc/goals/

議論しているのは Stein のリリースゴールで、Rocky もまだリリースされていないので、少し先の話であるということもあり、どうやってゴールを決めるかという話で盛り上がって楽しそうであった (メタ議論は楽しい)。

ゴールはオペレータにメリットがあるものであるべきだとか、なぜそのゴールが必要なのか開発チームともっとコミュニケーションとるべきだとか、何か目を引くものであるべきであるといった意見が出ていた。

過去のゴールを振り返ったり、backlog をスクリーンに映したりした後、セッションの終了時間が迫ってきたらやや唐突に具体的にどれをゴールにするかという話になっていたが、特に結論めいたものはなく、後日メイリングリストでも議論の続きをやっていた。