Angepasst aus dem Webinar So debuggen Sie das Verhalten von PCI Express Power Management und Dynamic Link von Patrick Connally und Gordon Getty

Einführung

Die Energieverwaltung ist ein wichtiger Aspekt für PCI Express® (PCIe®). Folglich spezifiziert PCIe den L1-Low-Power-Zustand. Wenn sich ein Link in L1 befindet, findet in beiden Richtungen keine Datenübertragung statt, sodass ein PCIe-Gerät im L1-Zustand weniger Strom verbraucht als im aktiven L0-Zustand.

L1-Substates (als L1.1 und L1.2 bezeichnet, wobei das ursprüngliche L1 in L1.0 umbenannt wurde) bieten noch tiefere Energieeinsparungen als L1, eine besonders wichtige Funktion für Laptops, Tablets und andere batteriebetriebene Geräte. Gerätedesigner müssen den Stromverbrauch während Niedrigenergiezuständen messen, um die Kompromisse zu bewerten und die Leistung zu optimieren.

Dies ist nur mit einem Protokollanalysator oder einem Oszilloskop allein schwierig zu bewerkstelligen. Protokollanalysatoren können auf Ereignisfolgen triggern und sehr lange Aufzeichnungen machen, aber sie können keine analogen Ereignisse erfassen. Oszilloskope können analoge Ereignisse erfassen, aber die Erfassungen sind sehr kurz und schwer mit Protokollereignissen zu korrelieren. Glücklicherweise ergänzen sich die beiden Instrumente sehr gut, um Ereignisse zu untersuchen, die von Prozessen höherer Schichten ausgelöst werden, aber Auswirkungen auf die physikalische Schicht haben – wie L1-Subzustände. Die Teledyne LeCroy KreuzDas Software-Framework Sync™ PHY für PCIe synchronisiert Triggerung, Erfassung und Analyse auf den beiden Instrumenten, um eine vollständige Sichtbarkeit der Verbindung zu gewährleisten.

Beispiele in diesem Anwendungshinweis zeigen, wie Stromverbrauchsmessungen für L1-Unterzustände basierend auf logischen Zuständen in der Datenverbindungsschicht oder dem logischen Unterblock der physikalischen Schicht und den entsprechenden Wellenformen im elektrischen Unterblock der physikalischen Schicht durchgeführt werden.

Übersicht der L1-Substates

Ein Gerät wechselt über einen von zwei Mechanismen in den L1-Zustand: Active State Power Management (ASPM) oder PCI Power Management (PCI-PM). Ein Gerät wird seine Unterstützung für L1-Unterzustände und -Eintrittsmechanismen in seinem Konfigurationsraum anzeigen und es wird das Taktanforderungssignal (CLKREQ#, aktiviert wenn niedrig) zum Verlassen und Eintritt in einen L1-Unterzustand verwenden.

Die Datenverbindungsschicht im PCIe-Protokollstapel behandelt Verbindungsverwaltungsaufgaben wie die Initialisierung von Flusssteuerungskrediten, die Aktualisierung von Flusssteuerungskrediten, wenn die Verbindung im L0-Zustand aktiv ist, und die Bestätigungs- und Negativbestätigungsmechanismen um sicherzustellen, dass die Pakete über die Verbindung hinweg unversehrt bleiben. Die Datenverbindungsschicht verwaltet auch Anforderungen zum Eintritt in L1 und seine Unterzustände für einen Niedrigleistungsbetrieb.

Konfigurationsraum, der die Unterstützung für L1-Unterzustände und -Eintragsmechanismen anzeigt.
Abbildung 1. Konfigurationsraum, der die Unterstützung für L1-Unterzustände und -Eintragsmechanismen anzeigt.

Messung der L1-Substate-Leistung

Um L1-Substate-Leistungsmessungen durchzuführen, verwenden Sie einen PCIe-Protokollanalysator wie das Teledyne LeCroy Summit T54 zusammen mit einem Oszilloskop wie dem Teledyne LeCroy LabMaster 10Zi-A. Darüber hinaus überwacht ein Interposer die Kommunikation mit dem zu testenden Gerät und liefert Daten an den Protokollanalysator sowie das Oszilloskop.

Testaufbau für L1-Substate-Messungen mit CrossSync PHY für PCIe-Software.
Abbildung 2. Testaufbau für L1-Substate-Messungen mit CrossSync PHY für PCIe-Software.

Wir wollen messen, wie viel Strom ein Gerät in jedem Zustand verbraucht: während L0 (bevor es in den Niedrigenergiezustand geht), während des Niedrigenergie-Unterzustands und dann in L0, wenn es aus dem Niedrigenergie-Unterzustand zurückkehrt. Wir werden uns diese drei verschiedenen Abschnitte ansehen, die in einem Timing-Diagramm dargestellt sind, und messen, wie viel Strom das Gerät verbraucht, was einen anderen Messaufbau als den für Timing-Messungen verwendeten erfordert.

Leistungsmessungen während L0, während des Low-Power-L1-Unterzustands und bei der Rückkehr zu L0.
Abbildung 3. Leistungsmessungen während L0, während des Low-Power-Subzustands L1 und bei der Rückkehr zu L0.

Trigger und Erfassung einrichten

Das Oszilloskop sollte so konfiguriert werden, dass es vier Signale erfasst: Hochgeschwindigkeits-PCIe-Upstream-Daten auf C2 und Downstream-Daten auf C3 sowie Schienenspannung und -strom auf C1 und C4. Es kann mit einer ziemlich langen Zeitbasis bei einer reduzierten Abtastrate konfiguriert werden (wir haben 10 GS/s verwendet), da wir uns hauptsächlich um die Leistungssignale auf C1 und C4 kümmern.

Konfigurieren Sie den Protokollanalysator so, dass das Oszilloskop zu Beginn des Niedrigleistungszustands getriggert wird, wenn die Taktanforderung deaktiviert wird.

Trigger-Setup für L1-Substate-Leistungsmessungen.
Abbildung 4. Trigger-Setup für L1-Substate-Leistungsmessungen.

Sondieren und Einrichten von Math Traces

Der Sondierungsaufbau für Leistungsmessungen unterscheidet sich geringfügig von denen für Zeitmessungen. Unter Verwendung von differentiellen Sonden mit hoher Bandbreite untersuchen wir die Upstream-Daten von Spur 0 und die Downstream-Daten von Spur 0 (C2 und C3), sodass wir die Aktivität auf mindestens einer der Hochgeschwindigkeitsspuren sehen können. Wir prüfen auch die Schienenspannung mit dem CrossSync PHY-Interposer, der Zugriff auf die 3.3-V-Stromversorgungsschiene des Geräts bietet (wir haben die aktive Spannungsschienensonde RP4030 von Teledyne LeCroy an C1 verwendet). Ein Serien-Shunt ermöglicht die Strommessung (C4), sodass wir Schienenspannung und -strom in Echtzeit betrachten können.

Beachten Sie, dass das Gerät nicht vom Interposer mit Strom versorgt wird, obwohl es vom Interposer abgetastet werden kann; Es bezieht seine Energie immer noch vom Host, was es uns ermöglicht, eine dynamische Energieanalyse durchzuführen.

Wir haben eine mathematische Oszilloskop-Funktionsspur (F2) eingerichtet, um den Stromverbrauch als gemessene Schienenspannung multipliziert mit dem gemessenen Schienenstrom (C1*C4) zu berechnen.

CrossSync-PHY-Interposer, der Zugriff auf die 3.3-V-Versorgungsschiene des Geräts bietet (in vergrößerter Ansicht oben rechts dargestellt).
Abbildung 5. CrossSync-PHY-Interposer, der Zugriff auf die 3.3-V-Versorgungsschiene des Geräts bietet (in vergrößerter Ansicht oben rechts dargestellt).

Stromverbrauch messen

Unsere erste Leistungsmessung findet mit dem Link in L0 statt, bevor das Gerät in L1 eingetreten ist. Die mathematische Funktion multipliziert C1 mit C4, um den Energieverbrauch im L0-Zustand vor der Deaktivierung von CLKREQ# zu berechnen. In unserem Beispiel beträgt der Wert 2.144 W. Bei Eingabe von L1.2 für einen Zeitraum von etwa 16 ms werden die Upstream- und Downstream-Signale elektrisch inaktiv, und die Leistungsaufnahme sinkt auf weniger als 200 mW – die Leistung wurde um mehr als reduziert Faktor 10.

Die mathematische Funktion F2 multipliziert C1 mit C4, um den Energieverbrauch im L0-Zustand vor der Deaktivierung von CLKREQ# zu berechnen.
Abbildung 6. Die mathematische Funktion F2 multipliziert C1 mit C4, um den Stromverbrauch im L0-Zustand vor der Deaktivierung von CLKREQ# zu berechnen.
Durchschnittliche Leistungsaufnahme auf 195 mW reduziert Während der ungefähr 16 ms, die die Verbindung in L1.2 verbleibt.
Abbildung 7. Durchschnittliche Leistungsaufnahme auf 195 mW reduziert Während der etwa 16 ms, die die Verbindung in L1.2 verbleibt.

Wenn die Verbindung L1.2 verlässt, kann der Downstream-Port aktiv werden, während der Upstream-Port im Leerlauf bleibt, was zu einem Stromverbrauch von etwa einem halben Watt führt. Wenn sich die Verbindung wieder vollständig im aktiven Zustand befindet und sowohl Upstream- als auch Downstream-Ports aktiv sind, steigt der Stromverbrauch auf 2.352 W.

Durchschnittliche Leistungsaufnahme von 520 mW bei aktivem Downstream-Port und Leerlauf des Upstream-Ports.
Abbildung 8. Durchschnittliche Leistungsaufnahme von 520 mW, wenn der Downstream-Port aktiv und der Upstream-Port im Leerlauf ist.
Durchschnittliche Leistungsaufnahme von 2.352 W mit Linkback im aktiven Zustand.
Abbildung 9. Durchschnittliche Leistungsaufnahme von 2.352 W bei aktivem Linkback.

Fazit

Die L1-Substates können erhebliche Energieeinsparungen bei PCIe-Verbindungen bieten. Die Kombination aus Oszilloskop, Protokollanalysator, Interposer u KreuzDie Sync PHY for PCIe-Software bietet eine effektive Möglichkeit, zu jedem Punkt im Verbindungsbetrieb zu navigieren, um Stromverbrauchsmessungen durchzuführen sowie Bedingungen wie Spannungsabfall und andere Probleme der Leistungsintegrität zu untersuchen.

Weitere Informationen zur Teledyne LeCroy KreuzSync PHY-Software finden Sie auf unserer Website .