Um turbulente Strömungen bei höheren Reynoldszahlen mittels des LB-Verfahrens berechnen zu können, wurde das Smagorinsky-Subgrid-Modell der Large-Eddy-Simulation in das LB-Verfahren über Multirelaxation integriert.
Das Grundlagenkapitel gibt einen Überblick über gängige Verfahren der turbulenten Strömungssimulation und führt schrittweise auf das verwendete LB-LES-Kombinationsverfahren hin.
Zuerst wurde ein serieller Code geschrieben und dieser speziell für die Zielplattfrom eines Clusters aus Dual-Xeon-Prozessor-Knoten optimiert. Es wurden verschiedene Optimierungen ausprobiert, z.B. auch die SSE2-Technologie. Dann wurde der Code über Gebietszerlegung mittels MPI sowie OpenMP parallelisiert. Dabei wurden mehrere Optimierungen in Bezug auf Überlappung von Kommunikation und Berechnung ausprobiert. Sämtliche Optimierungen wurden gemessen und bewertet. Der Code wurde auch auf einer Itanium2-Maschine getestet, um den Einfluss der Rechnerarchitektur abzuschätzen.
Am Ende stehtein effizient parallelisierter, physikalisch korrekter Code und die Einsicht, dass optimale Geschwindigkeit nur bei spezieller Optimierung für eine bestimmte Rechnerarchitektur zu erreichen ist.
Das Grundlagenkapitel gibt einen Überblick über gängige Verfahren der turbulenten Strömungssimulation und führt schrittweise auf das verwendete LB-LES-Kombinationsverfahren hin.
Zuerst wurde ein serieller Code geschrieben und dieser speziell für die Zielplattfrom eines Clusters aus Dual-Xeon-Prozessor-Knoten optimiert. Es wurden verschiedene Optimierungen ausprobiert, z.B. auch die SSE2-Technologie. Dann wurde der Code über Gebietszerlegung mittels MPI sowie OpenMP parallelisiert. Dabei wurden mehrere Optimierungen in Bezug auf Überlappung von Kommunikation und Berechnung ausprobiert. Sämtliche Optimierungen wurden gemessen und bewertet. Der Code wurde auch auf einer Itanium2-Maschine getestet, um den Einfluss der Rechnerarchitektur abzuschätzen.
Am Ende stehtein effizient parallelisierter, physikalisch korrekter Code und die Einsicht, dass optimale Geschwindigkeit nur bei spezieller Optimierung für eine bestimmte Rechnerarchitektur zu erreichen ist.