プロダクトの根幹を担う
技術の基盤に携われるコース
pixivウェブエンジニアリング
内容
pixivは2007年から開発されている歴史あるPHPコードベースですが、長期間開発されているコードベースならではの問題があります。 このコースではpixiv開発で直面している課題に対して、型システムに基いた精密な静的解析ツールを活用した型付けの強化やルール作成、リファクタリングなどの課題に挑戦してもらいます。
使用技術・条件
PHPStan / Rector
技術的挑戦
pixivでは静的解析を単純なCIや開発時のLintとして活用しているだけでなく、拡張機能によって標準機能では実現できない型付けをしたり、Rectorというリファクタリングツールの独自のルールを運用しています。 メンターのtadsanは静的解析ツールやRectorの社内ルールの開発・メンテナンスのほか、必要に応じてupstreamへの貢献も行っています。
コースで出来る体験
静的解析ツールまたはRectorを用いて、型システムおよび構文木に基いた静的解析に挑戦します。 特定のプログラミング言語だけでなく、プログラミング言語そのものに強い興味がある方を歓迎します。PHPの経験はあると望ましいですが、必須ではありません。
メンター
tadsan
2012年入社、ピクシブ事業本部所属。 pixivおよびピクシブ百科事典の開発を担当。個人ではEmacs PHP Modeの開発やPHPStanへの貢献をしています。
メンターからのメッセージ
動的言語の静的型付け──型理論を学んできた方には撞着語法のようにも感じられるかもしれませんが、近年はTypeScriptの例にも見られるように動的言語にも後付けの型システムを載せて静的解析する技術も発展を見せています。近年活用されているPHPStanは実行時情報と静的型検査を両立できる技術です。型システムの現場での実践に興味のある人もPHP以外の動的言語の静的解析に興味がある人もPHPStanとRectorにチャレンジしてみませんか?
ImageFlux
内容
画像変換・配信、および、ライブ動画配信サービスであるImageFluxの開発を行うコースです。 ImageFluxの主に画像変換機能について、レイヤーの低い技術を活用して機能追加/性能向上に取り組んでいただく予定です。
使用技術・条件
Golang / C / 画像処理 / 画像エンコーディング / HTTP / SIMD
技術的挑戦
ピクシブでは、各サービスの開発負荷を軽減しつつ安定した配信を行えるよう、動的に画像を変換しながら高速で配信を行う技術基盤を整備してきました。こうして培った画像変換・配信技術を、さくらインターネットとの協業でImageFluxというサービスとして外部にも提供しています。画像変換・配信エンジンは主にGoを用いて開発しており、大量のリクエストを効率的に捌くための様々なチャレンジを行っています。
コースで出来る体験
大量のリクエストを捌くための高速化・省メモリな設計と実装、耐障害性を高めるためのプロセス分割とそれらの協調といった、大規模配信システムならではのシステム設計を行っています。また、ピクセル単位での画像処理アルゴリズムの実装、C言語を利用した高速化、ネイティブライブラリの活用など、低レイヤの画像処理を取り扱っています。大規模配信システム全体を俯瞰的に眺めつつ、テクニカルな実装力を低いレイヤで試される体験ができます。
メンター
nontan
2020年新卒入社。新規事業部VRoid部にてVRoid Studio・VRoidモバイルの開発に携わり、現在は技術開発本部配信技術部にてImageFlux・画像変換機能の開発に従事。趣味は競馬観戦とゲーム。
機械学習
※機械学習コースは、2024年9月4日(水)〜9月13日(金)のみの開催となります
内容
ピクシブのいずれかのサービスにおいて、大量のデータを使った機械学習モデル開発/バックエンド開発/データ処理ワークフロー構築/効果測定に取り組んでいただきます。興味や期間に応じてタスクを設定させていただきます。
使用技術・条件
Python/PHP/BigQuery/Airflow/digdag/TensorFlow/Pytorch
技術的挑戦
機械学習チームは、ピクシブの各サービスにおいてレコメンドの導入や改善を行っています。pixivにおいてはイラスト・マンガ・小説、FANBOXではクリエイター 、pixivコミックでは作品、BOOTHでは商品のレコメンドを扱っています。機械学習モデルの構築、バックエンド開発、データ分析、施策立案などさまざまなタスクを通して、よりユーザーの満足度を高めるための挑戦を日々行なっています。 https://inside.pixiv.blog/2022/09/20/103000 https://inside.pixiv.blog/2022/09/13/103000 https://inside.pixiv.blog/2023/03/02/140000
コースで出来る体験
チームで利用している技術として、ニューラルネットワークを用いた類似画像や行列分解、バンディットアルゴリズム 、多様性を考慮したレコメンドなどがあります。上記だけでなく、インターンを通して、大量のデータを使った機械学習モデル開発・バックエンド開発・データ処理ワークフロー構築・効果測定などに触れていただきます。
メンター
gumigumi4f
2021年度中途入社。前職から一貫して各種サービスのレコメンドの改善を行っています。kaggle expert。得意な技術は機械学習を使った因果推論など。趣味は音ゲー。
データ分析
内容
アド・プラットフォーム事業部では広告配信プラットフォーム『pixiv Ads』を開発しています。本コースではpixiv Adsの広告配信ログやピクシブの各サービスのデータを用い、広告配信におけるロジック改善や課題発見に取り組んでいただきます。ドメイン知識と統計学、データエンジニアリングをかけ合わせ、広告配信システムを改善する体験が得られます。
使用技術・条件
GCP (BigQuery, Bigtable, Colaboratory, Vertex AI Workbench等) / Python / Go
技術的挑戦
ピクシブの広告配信システムには、月間800億件以上の広告リクエストが送られてきます。データ分析チームでは、この規模の利用に耐えうる広告配信システムを安定稼働させると同時に、配信ログを活用した、よりユーザーにマッチした広告を届けるための課題発見にも取り組んでいます。私たちは『創作活動を、もっと楽しくする。』というミッションのために会社がとれる選択肢を増やすため、BigQueryに蓄積されたビッグデータを活用し収益基盤を改善してきました。
コースで出来る体験
ピクシブには、創作やサブカルチャーに関するTB単位のデータがあります。これらのデータは全てBigQueryに集約しています。また、アドプラットフォーム事業部では分析用データパイプラインを設計・運用し、データに基づいた意思決定や機械学習システムなどへの応用を行っています。ドメイン知識と統計学、データエンジニアリングをかけ合わせ、広告配信システムを改善する体験が得られます。
メンター
mytk
2018年4月新卒入社。pixivの広告配信システムの改善や、データ分析、数値計測に関わっている。趣味はゲーム。
データ基盤
内容
ピクシブではBigQueryをデータインフラとしてたくさんの社員が使っています。このBigQueryの管理をデータ基盤チームで担当しています。 このコースではBigQueryを社内の利用者がより安全に、安心して使ってもらえる仕組み作りに取り組んでいただきます。データエンジニアリング・データマネジメントという希少性が高い技術を専門としている社員をメンターとして迎えて、データエンジニア・データマネジメントエンジニアの業務を体験していただくのが特徴です。
使用技術・条件
SQL / GCP (BigQuery・Dataplex・Cloud Logging・Cloud Monitoring・IAM) / Terraform / Git / Python / Airflow / Looker
技術的挑戦
ピクシブでは全社が利用するBigQueryやLooker、Airflowといったデータインフラの管理・整備をしています。データ基盤チームでは進化の早い最新のデータエンジニアリングにまつわる技術をキャッチアップしながら、全社のデータ利活用をインフラ面から加速化しています。 主な利用者はアプリケーションエンジニア・バックエンドエンジニア・ビジネス職などといったデータの専門家ではない人達になります。 データの非専門家でも精度の高い意思決定を、少ない工数で高速に行うために必要なことは何かを考えながらインフラ設計を考えることが技術的挑戦になります。[1][2] また、ピクシブではBigQueryを日本でも有数の規模で運用しています。 こういった大規模なデータウェアハウスをいかに安定的にコストを抑えつつ運用するかも技術的課題になります。[3] [1]:https://inside.pixiv.blog/2023/07/24/120000 [2]:https://speakerdeck.com/kashira/pixiv-meetup-2023-pikusibunodeta-inhuratozu-zhi-gou-zao [3]:https://inside.pixiv.blog/2023/04/10/150000
コースで出来る体験
学生では触れる機会が少ないデータエンジニアリング・データマネジメントというカテゴリの技術に触れてもらいます。また日本有数の大規模なBigQueryに触れることが出来る機会でもあります。
メンター
kashira
2021年中途入社。CTO室プラットフォーム開発部にてデータインフラの整備とデータマネジメントをやっています。得意なワークフローはAirflowです。趣味は漫画読んだり、なろう小説を見るのが好きです。
インフラ(SRE)
内容
ピクシブのオンプレミス環境で運用しているシステムに関して、可用性・信頼性・保守性等の改善に関わる施策に取り組んでいただきます。領域として主にミドルウェアについて扱いMySQL・fluentdなどを想定していますが、興味に応じて対応させていただきます。
使用技術・条件
Linux(Debian), PHP, Ruby on Rails, Solr, MySQL, Elasticsearch, fluentd, Apache, Apache Traffic Server, Nginx, Datadog など
技術的挑戦
ピクシブでは、自社で構築したインフラを利用して、pixivおよびpixiv関連サービスを支えています。これには数百台規模のサーバが含まれ、秒間15万リクエスト・40万クエリ以上を処理し、70Gbpsを超えるトラフィックを無理なく安定的にさばく必要があります。 インフラ部SREチームでは、サービスの拡大やユーザの増加に伴い日々増大していく課題に対応し、システム設計や物理的な機器調達はもちろん、OSやミドルウェアのパフォーマンスチューニングなどを行っています。
コースで出来る体験
インターンを通じて、大規模トラフィックをさばくオンプレミスのサーバー群に触れながら、実際に手を入れ、改善することができます。
メンター
picopico
2023年に新卒入社し、pixiv事業本部と技術開発本部を兼務しています。バックエンドのアーキテクチャ改善やサーバーの構築・システム設計など幅広く行っています。
メンターからのメッセージ
クラウドが定番になってきた昨今においても、オンプレミスの需要はまだまだ多いです。pixivを支える大規模インフラ基盤に興味がある方・挑戦してみたい方は、ぜひ応募してみてください!
Webサービス
プロダクトのバックエンド / フロントエンド開発に携われるコース
pixiv(イラスト・マンガ・小説)フロントエンド
イラスト、マンガ、小説作品の投稿プラットフォームpixivのフロントエンド開発コースです
pixiv(イラスト・マンガ・小説)バックエンド
イラスト、マンガ、小説作品の投稿プラットフォームpixivのバックエンド開発コースです
pixivコミック
マンガサービス・アプリ「pixivコミック」のバックエンド開発コースです
pixivコミックインディーズ
出版社と提携したマンガ投稿サービスのバックエンド開発コースです
BOOTH
創作物のためのマーケットプレイス「BOOTH」のウェブ開発コースです
Palcy
少女・女性マンガ中心のマンガアプリ「Palcy」のWebAPI開発をメインとするコースです
Pastela クラウド
iPad向けお絵描きアプリケーション「Pastela」の開発コースです
VRoid
VRoidプロジェクト関連の開発に携われるコース
PAGETOP