Kluster ger möjligheter, men defintivt också problem som gör att man tvingas lära sig en hel del om nätverk och sådant som hitintills inte varit särskilt intressant. Jag har för närvarande tre trimmade datorer, vilka ska jobba tillsammans för att snabbt simulera bränder i stora byggnader. Datorerna, namngivna efter stora matematiker fungerar utmärkt var för sig, men när de kopplas ihop verkar det som ”Euler” och ”Newton” inte riktigt är bästa vänner med ”Perelman”. Av någon anledning är där en fördröjning i kommunikationen som gör att systemets presentanda minskar. T.ex kan Euler och Newton räkna på en parallell körning snabbare om de är ensamma om jobbet, än om Perelman också ska vara med.
Just nu pågår felsökning och optimering av nätverket. Jag har upptäckt att FDS är komplierat för en version av MPI (Message Passing Interface)Â kallad MPICH1, vilken inte har uppdaterats sedan 2003. Numera bedrivs utveckling i en standard kallad MPI 2 och då finns MPICH2 tillgänglig. Men eftersom fds4_mpi.exe inte fungerar med MPICH2 eller andra specifika MPI-program för Windows som DeinoMPI behöver jag kompliera om källkoden för FDS. När detta är gjort kommer jag ha möjlighet att bygga ett kluster baserat på Windows XP med helt annan möjlighet till kontroll och styrning än vad MPICH1 medger.
Har du också kluster-strul, skicka ett mail så kan vi utbyta erfarenheter…