PFN の Kubernetes クラスタにおける Uninterruptible Sleep との付き合い方 | Preferred Networks Research & Development

PFN の Kubernetes クラスタにおける Uninterruptible Sleep との付き合い方 | Preferred Networks Research & Development

Preferred Networks エンジニアの坂田です。普段は社内向けの GPU サーバークラスタの運用管理の業務などをやっております。 先日、DevOpsDays Tokyo 2021 というイベントで、弊社 須田と一緒に PFN が Kubernetes を使って GPU

11 mentions: @preferred_jp
Keywords: kubernetes
Date: 2021/06/09 02:23

Referring Tweets

@preferred_jp 【ブログ】PFNでは機械学習基盤としてKubernetesクラスタを運用しており、その中で発生するさまざまな障害対応の自動化、省力化に取り組んでいます。本エントリではその事例の一つをご紹介します。 t.co/Vcsw1EtQhf

Bookmark Comments

Related Entries

Read more 〜AutoMLで実践する〜 ビジネスユーザーのための機械学習入門シリーズ 【第 3 回】 「積ん読」と「体重増」の悩みを AutoML で解決しよう | Google Cloud Blog
27 users, 13 mentions 2021/03/22 05:21
Read more MLエンジニアとML Opsが協力してサービスの運用負荷を劇的に改善した話 | メルカリエンジニアリングToTop
2 users, 6 mentions 2021/05/12 10:49
Read more ついにラベル無しで音声認識を実現した Facebook の wav2vec-U を解説【論文速報】
3 users, 3 mentions 2021/05/28 00:00
Read more 機械学習の知識がないけどゲームAIを作って唐揚げを大量に食べる|柞刈湯葉 Yuba Isukari|note
39 users, 9 mentions 2021/06/01 10:47
Read more 画像ベースの仮想試着の実用化に向けた課題とアプローチ - ZOZO Technologies TECH BLOG
3 users, 11 mentions 2021/06/11 02:00

ML-Newsについて

ML-Newsは機械学習に関するニュースサイトです。機械学習に関する論文ブログライブラリコンペティション発表資料勉強会などの最新の情報にアクセスできます。

機械学習を応用した自然言語処理、画像認識、情報検索などの分野の情報や機械学習で必要になるデータ基盤やMLOpsの話題もカバーしています。
安定したサイト運営のためにGitHub sponsorを募集しています。

お知らせ