MySQL / データの読み取りとクエリ
MySQL でのスロークエリのプロファイリングと最適化
はじめに
データベースシステムのパフォーマンスを維持することは、データベースを利用したアプリケーションの応答性を最適化する上で不可欠な部分です。これには、サーバーのハードウェアリソースとソフトウェア構成の管理が含まれますが、実行を要求するクエリにも関係します。
前のガイドでは、MySQL でパフォーマンスの低いスロークエリを特定する方法を調べました。このガイドでは、次のステップとして、実行速度の遅いクエリを評価および最適化する方法について説明します。これは、パフォーマンスの低いクエリに関連する問題を特定して修正するための完全な戦略を提供するために、前の記事の議論に基づいて構築されます。
スロークエリの段階を理解するためにクエリプロファイリングを有効にする
スロークエリを最適化しようとする際に最初に行うことの 1 つは、クエリをプロファイリングして、クエリが最も時間を費やしている場所を正確に発見することです。
まず、クエリプロファイリングが有効になっているかどうかを typing で確認します
SELECT @@PROFILING;
+-------------+| @@profiling |+-------------+| 0 |+-------------+1 row in set, 1 warning (0.00 sec)
0 は、プロファイリングが現在無効になっていることを示します。プロファイリングを有効にするには、typing で入力します
SET PROFILING = 1;
プロファイリングが有効になったら、typing で利用可能なプロファイルのリストを開始できます
SHOW PROFILES;
+----------+------------+--------------------------+| Query_ID | Duration | Query |+----------+------------+--------------------------+| 1 | 3.00368075 | select sleep(3) || 2 | 0.00740700 | select * from mysql.user || 3 | 0.00075875 | select @@profiling |+----------+------------+--------------------------+3 rows in set, 1 warning (0.00 sec)
出力には、プロファイリングが有効になってから現在のセッションで実行された最新のステートメントが表示されます。各クエリには、合計実行時間と、より深く掘り下げるために使用できるクエリ番号が表示されます。
最新のクエリのプロファイリング情報を表示するには、typing で入力します
SHOW PROFILE;
+----------------------+----------+| Status | Duration |+----------------------+----------+| starting | 0.000144 || checking permissions | 0.000020 || Opening tables | 0.000024 || init | 0.000013 || optimizing | 0.000047 || executing | 0.000032 || end | 0.000010 || query end | 0.000016 || closing tables | 0.000012 || freeing items | 0.000367 || cleaning up | 0.000074 |+----------------------+----------+11 rows in set, 1 warning (0.00 sec)
デフォルトでは、出力には、ステートメントがクエリ処理の各段階に費やした時間が正確に表示されます。これは、クエリのどの部分のパフォーマンスが低いかを正確に特定するのに役立ちます。
別のクエリに関連付けられた結果を表示するには、SHOW PROFILES
出力によって提供されるクエリ ID とともに FOR QUERY <N>
句を追加できます。
たとえば、クエリ 1 のデフォルト表示を取得するには、typing で入力できます
SHOW PROFILE FOR QUERY 1;
+----------------------+----------+| Status | Duration |+----------------------+----------+| starting | 0.001419 || checking permissions | 0.000028 || Opening tables | 0.000030 || init | 0.000020 || optimizing | 0.000020 || executing | 0.000025 || User sleep | 3.000165 || end | 0.000043 || query end | 0.000019 || closing tables | 0.000012 || freeing items | 0.000540 || logging slow query | 0.001320 || cleaning up | 0.000041 |+----------------------+----------+13 rows in set, 1 warning (0.00 sec)
ここで、出力は User sleep
ステータスに長い時間が費やされていることを明確に示しており、これは実行された関数を直接管理します。
出力の表示形式を変更して、さまざまな種類の情報を表示することもできます。これは、より具体的な情報を確認するためにデフォルト出力を表示した後で役立つことがよくあります。
たとえば、最初のクエリのブロック入力と出力に関する情報を typing で確認できます
SHOW PROFILE BLOCK IO FOR QUERY 1;
+----------------------+----------+--------------+---------------+| Status | Duration | Block_ops_in | Block_ops_out |+----------------------+----------+--------------+---------------+| starting | 0.001419 | 184 | 0 || checking permissions | 0.000028 | 0 | 0 || Opening tables | 0.000030 | 0 | 0 || init | 0.000020 | 0 | 0 || optimizing | 0.000020 | 0 | 0 || executing | 0.000025 | 0 | 0 || User sleep | 3.000165 | 0 | 0 || end | 0.000043 | 0 | 0 || query end | 0.000019 | 0 | 0 || closing tables | 0.000012 | 0 | 0 || freeing items | 0.000540 | 0 | 0 || logging slow query | 0.001320 | 64 | 8 || cleaning up | 0.000041 | 0 | 0 |+----------------------+----------+--------------+---------------+13 rows in set, 1 warning (0.00 sec)
以前の情報に加えて、これにより、MySQL がファイルシステムのブロックデータと対話する必要があった時間が表示されます。
指定できる使用可能な出力バリエーションには、次のようなものがあります
ALL
: 利用可能なすべての情報を表示しますBLOCK IO
: クエリが生成した入力および出力のブロック数を表示しますCONTEXT SWITCHES
: クエリの実行中に発生した自発的および非自発的なコンテキストスイッチの数を表示しますCPU
: ユーザースペースおよびシステムカテゴリの CPU 時間を表示しますIPC
: 送受信されたプロセス間メッセージの数を表示しますPAGE FAULTS
: ページフォールトの数を表示します。メジャーフォールトとマイナーフォールトに分類されますSOURCE
: 実行マッピングを可能にするために、MySQL 内で実行されている実際の関数をソースファイルと行番号とともに表示しますSWAPS
: クエリに必要なスワップの数を表示します
クエリに関連付けられた可能なすべての情報を表示するには、typing で入力します
SHOW PROFILE ALL FOR QUERY 1\G
追加の出力が多数表示されるため、結果を読みやすくするために、\G
ステートメント終了シーケンスで代替出力フォーマットをトリガーします。
プロファイリング情報を使用して、クエリのどの部分が遅いかについて良いアイデアを得たら、リソースを節約するためにプロファイリングをオフに戻すことができます
SET PROFILING = 0;
クエリパフォーマンスを理解するために EXPLAIN
を使用する
クエリプロファイルは、実行に最も時間がかかっているクエリ実行の段階と、クエリに関連付けられているリソースを理解するのに役立つはずです。次に、MySQL の EXPLAIN
ステートメントを使用して、クエリオプティマイザーによるクエリの評価を理解できます。
EXPLAIN
ステートメントは、SELECT
、DELETE
、UPDATE
、INSERT
、または REPLACE
ステートメントを受け取り、クエリオプティマイザーが指定されたクエリをどのように評価および実行するかを表示します。出力には、MySQL がテーブルを結合する方法、フィールドを選択する方法、結果をソートおよびフィルタリングする方法などが表示されます。また、評価される行数や、プロセスを高速化するために参照されるインデックスなど、さまざまな情報も表示されます。
このステートメントの動作を理解するために、MySQL にクエリ SELECT * FROM INFORMATION_SCHEMA.VIEWS;
をどのように実行するかを説明してもらいます
EXPLAIN SELECT * FROM information_schema.views\G
*************************** 1. row ***************************id: 1select_type: SIMPLEtable: catpartitions: NULLtype: indexpossible_keys: PRIMARYkey: namekey_len: 194ref: NULLrows: 1filtered: 100.00Extra: Using index*************************** 2. row ***************************id: 1select_type: SIMPLEtable: vwpartitions: NULLtype: refpossible_keys: schema_id,type,view_client_collation_id,view_connection_collation_id,type_2key: typekey_len: 1ref: constrows: 100filtered: 100.00Extra: Using where*************************** 3. row ***************************id: 1select_type: SIMPLEtable: schpartitions: NULLtype: eq_refpossible_keys: PRIMARY,catalog_idkey: PRIMARYkey_len: 8ref: mysql.vw.schema_idrows: 1filtered: 100.00Extra: Using where*************************** 4. row ***************************id: 1select_type: SIMPLEtable: conn_collpartitions: NULLtype: eq_refpossible_keys: PRIMARYkey: PRIMARYkey_len: 8ref: mysql.vw.view_connection_collation_idrows: 1filtered: 100.00Extra: NULL*************************** 5. row ***************************id: 1select_type: SIMPLEtable: client_collpartitions: NULLtype: eq_refpossible_keys: PRIMARY,character_set_idkey: PRIMARYkey_len: 8ref: mysql.vw.view_client_collation_idrows: 1filtered: 100.00Extra: NULL*************************** 6. row ***************************id: 1select_type: SIMPLEtable: cspartitions: NULLtype: eq_refpossible_keys: PRIMARYkey: PRIMARYkey_len: 8ref: mysql.client_coll.character_set_idrows: 1filtered: 100.00Extra: NULL6 rows in set, 1 warning (0.01 sec)
上記の出力は、そのクエリの情報をまとめるために 6 つの個別のクエリが必要であることを示しています。テーブル定義を見ると、理由がわかります
SHOW CREATE TABLE information_schema.views\G
フォーマットを変更すると、結果のテーブル作成コマンドは次のようになります
CREATE algorithm=undefined definer=`mysql.infoschema`@`localhost` SQL security definer view `views`ASSELECT `cat`.`name` AS `table_catalog`,`sch`.`name` AS `table_schema`,`vw`.`name` AS `table_name`,IF((can_access_view(`sch`.`name`,`vw`.`name`,`vw`.`view_definer`,`vw`.`options`) = TRUE),`vw`.`view_definition_utf8`,'') AS `view_definition`,`vw`.`view_check_option` AS `check_option`,`vw`.`view_is_updatable` AS `is_updatable`,`vw`.`view_definer` AS `definer`,IF((`vw`.`view_security_type` = 'DEFAULT'),'DEFINER',`vw`.`view_security_type`) AS `security_type`,`cs`.`name` AS `character_set_client`,`conn_coll`.`name` AS `collation_connection`FROM (((((`mysql`.`tables` `vw`JOIN `mysql`.`schemata` `sch`ON ((`vw`.`schema_id` = `sch`.`id`)))JOIN `mysql`.`catalogs` `cat`ON ((`cat`.`id` = `sch`.`catalog_id`)))JOIN `mysql`.`collations` `conn_coll`ON ((`conn_coll`.`id` = `vw`.`view_connection_collation_id`)))JOIN `mysql`.`collations` `client_coll`ON ((`client_coll`.`id` = `vw`.`view_client_collation_id`)))JOIN `mysql`.`character_sets` `cs`ON ((`cs`.`id` = `client_coll`.`character_set_id`)))WHERE ((0 <> can_access_table(`sch`.`name`,`vw`.`name`))AND (`vw`.`type` = 'VIEW'))
5 つの結合ステートメントがあります。つまり、結果を構築するには 6 つの個別のテーブルをクエリする必要があります。これは、実行した EXPLAIN
ステートメントで返されたエントリの数(テーブルごとに 1 つ)と一致します。
EXPLAIN
ステートメントの結果を解釈するには、個々の列がそれぞれ何を表しているかを理解する必要があります。特に興味深いのは、type
、key
、rows
、および filtered
列です。
type
列の解釈
type
列は、MySQL がクエリ内の結合操作をどのように実装するかを示します。MySQL のドキュメントには、利用可能なさまざまな結合タイプと、それらがパフォーマンスにどのように影響するかについての適切な説明があります。
type: const
たとえば、const
のタイプは、MySQL が一意の列を定数値と比較していることを意味するため、非常に高速になります。これは、最大で 1 行を返す必要があります。
type: eq_ref
eq_ref
タイプも同様に、2 つのテーブルを結合するための最速の結合操作です。これは、クエリが比較のために完全な一意の非 NULL インデックス値を使用することを示しているためです。
type: index
index
タイプは、フルテーブルスキャンが必要な場合に使用されますが、実際のテーブルをスキャンする代わりに、クエリは代わりにインデックツリーをスキャンできます。これにより、クエリの範囲内ではパフォーマンスが比較的低くなりますが、実際のテーブルではなく小さなインデックスをスキャンできるため、ある程度最適化されています。
type: ref
ref
結合タイプは、MySQL がインデックスの先頭列を使用して比較できたことを意味します(インデックス全体に比較に使用されない複数の列が含まれている場合)。これは、MySQL が比較全体に一致しなくても、部分インデックスを効率的に使用できることを意味します。
key
列の解釈
key
列とその関連列(possible_keys
、key_length
、および ref
)は、インデックスが利用可能であったか、どのインデックスが使用されたか、およびインデックスの使用効率がどの程度であったかを理解するのに役立ちます。
. . .possible_keys: PRIMARYkey: PRIMARYkey_len: 8ref: mysql.client_coll.character_set_id. . .
possible_keys
列は、結合されているテーブルで使用可能なインデックスを示します。クエリを満たすのに適切なインデックスを見つけようとしたときに、MySQL が何から始めたかを示すため、役立ちます。テーブルをプライマリキー以外のキーで結合する場合は、プロセスを高速化するためにインデックスが利用可能であることを確認するために調べる場所になる可能性があります。
key
列自体は、MySQL がクエリを実行するために使用することにしたインデックスを示します。場合によっては、possible_keys
列にリストされていない結果も含まれる場合があります。たとえば、インデックスにクエリが要求するすべての列が含まれている場合、インデックスは実際の結合には適切ではなく(また使用されませんが)、関連付けられたテーブルよりも効率的にスキャンできます。
key_length
列は、実際のインデックスのどれだけが使用されたかを示します。複数列インデックスの場合、これは、この特定の比較に格納されているインデックスのどれだけが使用されたかを理解するのに役立ちます。ref
列も、特定のインデックスに対して具体的に何が比較されているかを示すことで、ここで役割を果たします。これは、より最適化されたインデックスを作成することが良いアイデアであるかどうかを判断するのに役立ちます。
評価された行の解釈
rows
列と filtered
列は、調べられているテーブルの範囲を示すため、役立ちます。
rows: 1filtered: 100.00
rows
列は、クエリの各部分を実行するために MySQL が評価する必要があると思われる行数を示します。ここでの数値は、これまで説明してきたすべての列の影響を受けます。ステートメントと利用可能なインデックスが与えられた場合、MySQL がテーブル全体をどれだけ効率的に削減できるかを示します。
filtered
列は、クエリ内の行フィルタリング条件が適用された後に返される評価された行の割合を推定します。値が 100 の場合、行フィルタリングが発生しないことを示します。100 未満の値は、評価された行の一部が結合条件またはその他のフィルタリングのために返されないことを示します。
高速に実行するためにスロークエリを書き換える
MySQL で個々のステートメントのパフォーマンスを評価し、速度低下の原因に関する詳細情報を取得する方法について説明しましたので、そのパフォーマンスを向上させる方法について説明します。
検討する正確な手順は、クエリプロファイリングと EXPLAIN
調査で何が見つかったかによって大きく異なります。以下に、クエリパフォーマンスを最適化するための最も一般的な方法をいくつか示します。
追加のインデックスを作成する
クエリの実行速度を向上させる最も簡単な方法の 1 つは、テーブルに適切なインデックスが利用可能であることを確認することです。インデックスは、データのクエリを実行する最も一般的な方法を反映する必要があり、使用状況の進化や追加のクエリの実装に伴って時間とともに変化する可能性があります。
新しいインデックスを作成するには、CREATE INDEX
ステートメントを使用できます
CREATE INDEX <index_name> ON <table> (<columns_to_index>)
インデックスを作成する列のデータ型、値の最大長、および使用するインデックス構造に応じて、作成できるインデックスにはさまざまな種類があります。クエリがすでにインデックスを使用しており、インデックスのパフォーマンスが低い場合は、これらのオプションを検討する価値があるかもしれません。ただし、最初は、ほとんどデフォルト値を使用して比較的シンプルに保つことができます。
最初に行う必要がある考慮事項は、どの列にインデックスを付けるかです。特定の列で定期的に結合する場合は、インデックスでそれらが考慮されていることを確認することが重要です。インデックスは主にロー検索で使用されるため、異なるテーブルのさまざまな行が一致する結合操作は、インデックスがないと非常にコストがかかります。
テーブルのクエリを通常どのように実行するかが完全にカプセル化されている場合は、単一の列でインデックスを作成できます。また、複数の列にインデックスを付けて、インデックスをより便利にすることもできます。複数の列にインデックスを付ける場合、順序は非常に重要です。最初の列は一致を検索する主な方法である必要があり、追加の列はそれらの一致を絞り込むのに役立つ必要があります。
たとえば、テーブル person
の first_name
と last_name
のインデックスを作成する場合、ほぼ間違いなく次のようなインデックスを定義する必要があります
CREATE INDEX last_and_first_names ON person (last_name, first_name);
ここで、last_name
列はインデックスの最初または左端の列です。つまり、Alan Smith
またはすべての Smith
エントリの検索が高速になります。ただし、first_name
による Alan
のすべてのインスタンスの検索には効果がありません。ただし、ファーストネームのみで頻繁にクエリを実行することを想定していない限り、おそらく問題ありません。
インデックスを作成すると、データセットの読み取りパフォーマンスを向上させるのに役立ちますが、テーブルに過剰なインデックスを付けないことが重要です。インデックスは書き込み速度にコストがかかります。新しい値がテーブルに記録されるたびに、それに関連付けられているすべてのインデックスも更新する必要があるためです。テーブルは、プライマリキーがそれらに対して使用されるクエリパターンによく適合している場合に最適に機能します。これにより、さまざまなアクセスパターンに対応するために多数の追加インデックスを必要とせずに、強力なインデックスパフォーマンスの恩恵を受けることができます。
候補行数を制限する
クエリを高速化するもう 1 つの方法は、可能な場合はステートメント内の候補および返される行数を制限することです。これは非常にコンテキスト固有の推奨事項であるため、多くの場合には適切ではありませんが、MySQL が評価する必要のある行数を削減できる場合は、パフォーマンスを大幅に向上させることができます。
これは、LIMIT
句で行うことができます。たとえば、5 つの結果のみを返すには、次のような形式を使用できます
SELECT * FROM <table> LIMIT 5
多くの場合(クエリに含まれる他の句によって異なります)、返される行数を制限すると、MySQL がクエリプロセスを短絡させ、通常よりも早く停止するのに役立ちます。これにより、データセット全体で実行してから後で結果を切り捨てるのではなく、早い段階で時間を節約できます。
これは、複数のテーブルを結合する場合に特に役立ちます。可能な限り、結合が発生する前にクエリの結果を制限するのが最適です。これにより、MySQL は最初のテーブル全体ではなく、残りの結合に対して少量のデータを評価できます。
関連するフィールドのみを選択する
クエリのパフォーマンスを向上させるもう 1 つの方法は、実際にどの列を返しているかに注意を払うことです。これは、さまざまな方法で結果を高速化するのに役立ちます。
選択する列を制限することがパフォーマンスに影響を与える主な方法は、ネットワークペイロードを最小限に抑えることです。不要な列を返すことで、大きなクエリはクエリによって生成されるネットワークトラフィックを大幅に増加させる可能性があります。クエリの論理制約を満たすために必要な列のみを選択すると、ネットワーク経由で転送されるものを削減することで、この問題を回避できます。
返す列を選択的に行うことがパフォーマンスに影響を与える可能性のあるもう 1 つの方法は、インデックスに関連しています。MySQL が返しているすべての列をインデックスに関連付けることができる場合、完全なテーブルではなく、その小さくてより整理されたデータセットで動作する可能性があります。クエリしている列を制限すると、インデックスがクエリパターンにうまく一致する場合に、これが可能になります。
先頭ワイルドカードとの比較を削除する
クエリのパフォーマンスに悪影響を与える可能性のあることの 1 つは、ワイルドカードへの過度の依存です。SQL では、%
文字は、任意の値を代入できることを示すワイルドカードとして比較で使用されます。これはレコード内でデータを見つけるための非常に強力な方法ですが、クエリパフォーマンスに非常に大きな影響を与える可能性があります。
これは、先頭またはプレフィックスワイルドカードに特に当てはまります。先頭ワイルドカードは、列値がワイルドカードで始まるパターンに一致するかどうかを確認する比較です。たとえば、列が %Main St.
に一致するかどうかを確認します。これは、MySQL がインデックスを使用して一致する結果を見つけることができないため、特にパフォーマンスが悪くなります。代わりに、その列にインデックスがあっても、一致するテーブル全体を検索する必要があります。
この特定の例では、その通りのすべてのアドレスを見つけるために通り名で定期的にクエリを実行する場合は、通り名と番地を 2 つの別々の列に分割する方が理にかなっている可能性があります。これにより、「Main St.」のアドレスをインデックスを使用してすばやくクエリし、特定のアドレスを探している場合は、必要に応じてそれらの結果をフィルタリングできます。通り名を最初、番地列を 2 番目とする複合インデックスを作成すると、さらに高速になります。
結論
このガイドでは、個々のクエリを評価し、速度低下の原因に関する詳細情報を取得するための基本的な方法のいくつかについて説明しました。クエリのプロファイリングと、クエリプランナーがクエリをどのように評価するかに関する詳細情報を取得するための MySQL の EXPLAIN
ステートメントの使用について説明しました。次に、データベースがデータを取得する方法により適切に一致するようにクエリを変更することで、これらの速度低下を回避できる方法をいくつか見てきました。
データベースは複雑なソフトウェアであり、さまざまな形式で大量のデータを扱う責任を負っています。必要なデータを単に取得するだけでなく、データベースは高速に結果を返すことが期待されています。MySQLのクエリプランナーとオプティマイザーのメカニズムには、クエリの応答にかかる時間を最小限に抑えるために、数え切れないほどの最適化が組み込まれています。
しかし、データベースが自動的に最適化できる範囲には限りがあります。データベースのユーザーとして、アクセスするデータ、クエリの要件、最適化する最も重要なクエリを理解する必要があります。そのためには、基準を評価し、クエリのパフォーマンスが期待どおりでない場合に調整する方法を理解することが重要です。
MySQLデータベースでPrismaを使用している場合は、ドキュメントのクエリ最適化セクションでクエリを最適化する方法について学ぶことができます。これは、Prismaを使用する際に、さまざまなクエリ構成がデータベースのパフォーマンスにどのように影響するかを理解するのに役立ちます。