In diesem Post behandle ich das neue Latency-Based Feature der Round Robin Path Selection Policy VMW_PSP_RR (Round Robin) welches bei Storage Multipathing Infrastrukturen benutzt wird.
Nun, zwar ist Round Robin die meist benutzte aller drei PSP Policies. Diese führte jedoch in einigen Situationen zu Frustration. Denn, was meist nicht bekannt ist, entschied PSP/NMP relativ “dumm” wann es den Wechsel auf den zweiten Path vollzog, nähmlich alle 1000 I/Os. Dies hatte zur Folge, dass auch ein Pfad Wechsel vollzogen wurde, wenn der zweite Pfad eigentlich viel zu hohe Latenz (zb. durch Überlastung des Switches/Controller) aufwies, wobei der erste Pfad eigentlich noch weitere Performanz liefern hätte können.
Ab vSphere 6.7 U1 wird diese Problematik nun gelöst, indem auch die Latenz des zweiten Pfads mit in die Entscheidungsreihenfolge einbezogen wird, ob ein Round Robin vollzogen wird. Dies macht wesentlich mehr Sinn und erlaubt ein viel besseres Load Balancing. Dies wird durch die Policy “PSPLatencyPolicy” bewerkstelligt, welche die 16 ersten I/Os zum Validieren der Pfad-Latenz benutzt. Die Validierung wird danach alle 3 Minuten vollzogen. Gemäss dem Ergebnis, wird auf den jeweiligen Pfad umgeschaltet. Falls einer der beiden Pfäde eine lange Latenz aufweist, wird dieser als “unhealthy” geflaggt und für die nächsten 3 Minuten nicht mehr benutzt. Ab 6.7 U1 ist die Policy per default auf dem ESXi aktiviert.
Ich empfehle, bei allen Datastores zu überprüfen, ob die Policy aktiviert ist. Manuel Walder
Ob für einen Datastore die neue Policy verwendet wird, kann wie folgt überprüft werden:
esxcli storage nmp psp roundrobin deviceconfig get -d <Device_ID>
Falls einen Datastore die neue Latency-Based Policy verwenden soll, kann folgendes benutzt werden:
esxcli storage nmp psp roundrobin deviceconfig set -d –type=latency
Hier der offizielle VMware Artikel:
https://storagehub.vmware.com/t/vsphere-storage/vsphere-6-7-core-storage-1/vsphere-6-7-u1-enhanced-round-robin-load-balancing/
Comments