月別プレイヤーランキング(オフライン)へのリンク一覧

日本語と英語で解説する内容が少し違うので両方読むとわかりやすいかもしれません。英語が得意ではないので、英語での評価方法は正確でない部分は多数あると思います。

評価方法(日本語)

ランキングの評価基準・手法

smashdata.ggのデータで期間内の2先3先の全ての試合結果から、この戦績を安定してとれるとした場合、最終的に収束するレートの近似(以下レート、または適性レート)で評価しています。慣用的に適正レートと呼ばれるものと同様です。レートの計算は取得ゲーム数で計算しています。
(評価値) = (重視する大会でのレート)*0.75+(全大会でのレート)*0.25
重視する大会は、90人以上の規模の大会、または、日本と海外の上位選手の対戦がある大会(SWT, Summit等)。特殊なルールは何もなく、基本的にどの人に対して戦績がどうだったかのみで評価されているので、かなりシンプルな方法です。期間終了時の評価ではなく期間中全体での評価で、他の期間の結果は一切含まれていません

レートの近似方法

プレイヤーのレートを期間中の全試合に対して更新を繰り返すことで近似しています。Kの値が小さいほど精度は上がりますが、レートが収束するのに時間がかかりすぎるため、Kの値を調整しながら小さいK値で収束するレートを近似しています。

近似によるランキングへの影響

終盤の結果がやや重視されているため、序盤や終盤での成績が著しく悪いと、序盤をやや重視したときと比べ、日本でのランキングやそれ以外の地域でのランキングでは3~4位程度は変わることがありますが、多くの人はランキングが変動しないためいい近似ができていると思います。終盤をやや重視したものを採用しています。それほど変わらないとは思いますが、世界ランキングでは精度を上げると日本の選手の順位が若干高くなっていく傾向があることから日本の選手がやや低めに評価されていると推測されます。この誤差よりも相性や試合数の少なさによる影響の方がはるかに大きく、これ以上誤差に拘る価値がないと判断しています。

対象の試合

smashdata.ggのデータを使用しています。start.ggの多くの試合は入っていますが、Challongeの試合は入っていない試合もかなりありそうです。データを取得した後からも対象期間内のデータが少し追加されているようですが、月末か月初めのデータ更新時のものを使用する予定です。このため、試合が行われた月には試合結果が反映されないことが起こり得ますが、次の月には反映されます。

ランキングの対象者

試合数が20戦以上、かつ、日本では90人以上の規模の大会に参加、海外では200人以上の規模の大会に参加。比較的幅広く対象を取っています。

日本と海外のプレイヤーの評価について

レートの収束化の過程から考えると、海外のプレイヤーのレートが初めは高くなります(おそらくプレイヤー数が多いため)が、日本の遠征したプレイヤーがそのレートを吸って、他の日本のプレイヤーに還元されていくことになります。日本と海外のプレイヤーの試合数が少ないと、この速度がかなり遅いため、日本のプレイヤーのレートはやや低めに評価されている傾向があります。基本的に遠征している日本の最上位プレイヤーが海外からレートを吸い上げているだけで、遠征していないプレイヤーがメタが違う海外で通用するかどうかはわかりません。逆に海外のプレイヤーが日本で通用するかどうかもわかりません。日本の選手の評価が高いように思う人も多いと思いますが、評価は海外遠征しているプレイヤーから見た相対的な位置として評価されているため、遠征している選手が海外よりも国内で苦戦しているためだと考えられます。イロレーティングから適性レートを求めたランキングなので、イロレーティングによる評価の歪みの影響を受けています。そういった影響の結果かもしれませんが、イロレーティングにどのような歪みがあるかを把握していないので判断できません。

試合数に関して

ランキング表ではだいたいの試合数の多さがわかるようにしていますが、規模が大きい大会に多く出ている人の評価の信頼度はかなり高く、規模の小さい大会にたくさん出ても信頼度は上がらないので、参考程度のものです。試合数が少なくても規模の比較的大きい大会で安定して戦績を残している人の信頼度はかなり高いです。海外のプレイヤーも試合数自体は多いのですが、一部の人を除けば大規模の大会にそれほど出ているわけではありません。また、規模の大きい大会はデータにほとんど入っていると思いますが、規模の小さい大会だとデータに入っていない大会も多数あります。

ランキングの性質

人やキャラの相性の影響がかなり大きいゲームで試合数が少な過ぎるためランキングの信頼度はそれほど高いものではありません。プレイヤーランキングというものの性質上、順位が高いからこの人の方が強いといったような確定的なランキングを出すことはできません。一定の基準で評価することで順序をつけ、だいたい合っているランキング、つまり、プレイヤーの強さを測る指標の一つとして出すことを目的としています。評価の信頼度は主に重視される大会での試合数に依存し、多い人の方が信頼度が高い傾向があります。月一でランキングを出しているので、試合に出続けている人であれば、ランキングの推移からだいたいの実力は把握できると思います。取得ゲーム数による適正レートで評価したものなので、ランキング対象かどうかにかかわらず、全プレイヤーに対して評価は行われています。

このランキングは主に比較的規模の大きいダブルエリミネーションによるトーナメントの結果が重視されていて、適正レートの評価です。そのため、上位のプレイヤーで好不調の波が大きい人は、レートに差のある人に勝ってもレートはほとんど上がらず、負けると大量に引かれるため、トーナメントの序中盤で脱落しやすいと、低めの評価になりやすいと思います。また、試合数が少ないので、かなり格下の人にゲームを取られるとレートが大量に溶けるので、上位のプレイヤーだと誰に負けるかはかなり重要になります。そのため、上位では未知の相手や不利相性でも、格下なら勝てるという安定感が重視されたランキングと言えると思います。ゲーム数において誰にどういう戦績だったかで判断されているので、対戦相手と結果が同じであれば、トーナメントの決勝であっても、初戦であっても評価はほぼ変わらない点は、順位によるポイント制のランキングとは大きく違います。高順位を取れそうなときにどこまで上へ行けるかというような勝負強さが評価されるランキングではなく、勝てる人にしっかり勝つことが重視される地道な印象のランキングだと思います。

注意点

滅多にいませんが、規模が大きめの大会での成績が良く、規模の小さい大会で成績が著しく悪い選手もいますが、この選手は本来低く評価されるべきですが、このランキングではかなり高く評価されてしまうことがあります。通常は逆のケースが多く、このケースの評価を高くするわけにはいかないので、ある程度は仕方ないと思います。ペナルティーをつければ補正できますが、どの程度補正するかを主観的に評価する必要があるため補正していません。

現状は不要なのでしていませんが、適正レートで評価しているため、交流が著しく少ない地域や独立した地域に関しては、恣意的にランキングから除外する可能性があります。独立した地域はそもそもレートが比較できませんし、交流が少ない地域だと信頼度が低かったり、誤差が大きめに出る可能性があるためです。海外でいうとオーストラリア、日本では沖縄の評価の信頼度がかなり低い場合があり、状況次第では独立したレートになる可能性もあると思います。

プレイヤーの使用キャラ表記について

start.ggの対戦結果での使用キャラが主なものなので、ほとんどの試合での使用キャラはわかりませんが、対象期間内で使用キャラ、全期間での使用キャラの優先順位で使用キャラを決定しています。一部の日本のプレイヤーは手動で使用キャラをを変更している場合があります。また、使用キャラは最大3体までとし、使用率が15%以下のキャラは使用キャラに含めていません。使用キャラは、マルスとルキナ、サムスとダークサムス、ピットとブラックピット、ピーチとデイジー、シモンとリヒターは同一表記としている点に注意してください。

Evaluation Method

Overview

This ranking is given out on a monthly basis and is based solely on offline match results for the 180 days prior to the beginning of the month. The ranking is based on the assumption that each player is able to consistently achieve the same results even when the number of matches is small, and is an approximation of the ratings that is expected to converge if the number of matches were sufficiently large for a sufficiently small K-factor with the Elo rating system. Rating fluctuations are based on game counts. Details are described below. It is a simple ranking where each player is evaluated only by which game count against whom.
The ranking is determined by the following formula:
Rating = (Rating at tournaments that I emphasize)*0.75 + (Rating at all tournaments)*0.25
In reality, the 180-day period is long enough that ability can fluctuate, but by keeping K-factor sufficiently small, the evaluation is calculated for the entire period as if ability did not fluctuate during the period. Note that the evaluation is made as an average, not as of the end of the period. Because of the small number of matches, the effects of the different distribution of opponents and characters for each player are ignored. The balance of ratings between regions can also be reasonably evaluated if there is a reasonable amount of interaction.
The most important point to note is that the ratings of players with a small number of matches are easily separated from their abilities. Since people with quite a few matches are included in the ranking, they can be considered out of the ranking, but it is true that they have a noteworthy record and are as good as they have been.
Common sense tells us that it is impossible to attribute a small difference in ranking to a difference in ability, due to the fact that there are too few matches and the bias of the opponents.

Tournaments that I emphasize and matches used for evaluation

Matches used for evaluation are all offline BO3 or BO5 matches on the smashdata.gg database during the period. The tournaments that I emphasize are tournaments with 90 or more participants, or tournaments where top players from Japan and other countries compete against each other (Summit, etc.), and some invitation-only tournaments (currently JAPAN 24 only). Basically, I would like to evaluate double-elimination tournaments with a large number of participants, but in order to accurately evaluate the balance between Japan and other regions, I also include tournaments where the top players from Japan and other countries play each other in the tournaments I emphasize. Tournaments that I am not emphasize are adjusted so as not to affect the evaluation too much, because the top-tier players are not obsessed with winning on the spot and often use them to make adjustments, and because the opponents are more likely to be biased.

Conditions for being listed in the rankings

The requirements are to participate in a minimum of 20 sets during the period and in a tournament with a minimum of 90 players in Japan or a minimum of 200 players overseas. The number of matches requirement is taken very low, but the requirement for participation in large tournaments is to exclude players from regions that do not interact with major regions, which is necessary to automate the ranking without complicating the requirements. In Japan, the limit is loosened to 90 people because the problem is not so serious at present.

Process

1. Get matches database from smashdata.gg
2. Calculate ratings for data-intensive competitions and for all matches. Methods for calculating ratings are listed below
3. Create a ranking by using the evaluation value = (Rating at tournaments that I emphasize)*0.75+(Rating at all tournaments)*0.25, and create a ranking with the ranking targets.

Method for calculating ratings

1. Get a set of match results to use
2. All players are given the same initial rating.
3. Update ratings for all match results by Elo rating system based on game count
4. Repeat step 3 until ratings converge to a certain degree
5. Lower the K-factor
6. Repeat steps 3, 4, and 5 until the K-factor is sufficiently small to determine each player's rating
The reason for not calculating with a small K-factor from the beginning is to reduce the computational complexity.

Notes

1. Since the purpose of the ranking is to include a fairly large number of people, people who have played a fairly small number of games are included in the evaluation, so the fewer the number of games, the more likely they are to be ranked far from their abilities. If you think a player has a small number of games, you can simply consider him or her to be out of the ranking, and you will be able to tell how good he or she is by looking at his or her future activities. Basically, the closer the color to the right of a player in the table is to red, the more unstable his/her rating tends to be. I will mention a few special cases. For example, it is not impossible to fulfill the conditions even if you have not participated in a tournament for five months. If the results of one month of activity are good, it is possible to remain at the top of the rankings five months later, even if you have been inactive since then. On the other hand, if you start playing and suddenly get only good results, it is also possible to quickly move up in the rankings. It is important to note that it is assumed that each player is able to consistently achieve the same results even when the number of matches is small.
2. The period is 180 days, which is long, and we expect that there will be changes in motivation and ability. The evaluation is made as if there is almost no fluctuation in ability during the period. It should also be pointed out that the evaluation is not made at the end of the period, but throughout the period.
3. Even those who have played a large number of games are strongly influenced by whether they are good or bad at their opponents,as the distribution of opponents is quite skewed. Some people are easily influenced by their opponents due to the characters they use.
4. It would be impossible to compare ratings in regions that do not interact with other regions, but I have not checked if such regions are included in the ranking. My policy is not to exclude a region from the rankings unless it comes in at the very top of the list, but I am not currently experiencing that problem. Also, if a region has significantly fewer interactions with other regions, it is likely that it may not be accurately approximated, and Australia may be affected by this.
5.Although many people may have the impression that rating matches are fought among those of equal rating, the opponents are mainly the result of double elimination. For top-ranked players, it is important to win consistently against lower-ranked players in order to receive a high rating.
6. Currently, many top-ranked Japanese players are participating in overseas tournaments, and I believe that the balance between Japan and overseas is well balanced. Compared to the rankings for the first half of 2022, the tournaments have been held relatively consistently, resulting in a stable ranking.
7. It is important to mention that in an invitational tournament with many top players, the relatively lower ranked players seem to tend to have an advantage in the evaluation. This is another reason why we would like to evaluate the results of double-elimination tournaments.

Impression

This is a ranking that I am compiling as a hobby, and I am only doing it out of interest in knowing what kind of people are strong in SSBU these days. The rankings seem to indicate no major mistakes, and I am satisfied with the quality, so I have no intention of changing my basic standards, but I may change the size of the tournaments that I emphasize.