diff --git a/README.md b/README.md index 522868926485ecec3a571851a67c78a99031bc66..e520f0a84c83c790df1fd44ed4ca20d3e0fceb69 100644 --- a/README.md +++ b/README.md @@ -40,24 +40,24 @@ Setelah penulis menulis kode diatas, penulis menemukan banyak hal yang dapat die # Jumlah Thread yang Digunakan ## 32 -Ketika melakukan pengerjaan melalui komputer pribadi, kami menemukan bahwa jika nilai thread lebih dari 2, ada kemungkinan program MPI tersebut stuck. Walaupun hal ini tidak pernah kami temukan di komputer remote. Maka dari itu untuk mendapatkan data yang konsisten kami memutuskan untuk menggunakan 2 thread saja +Ketika melakukan pengerjaan kami menemukan bahwa program yang kami modifikasi menjadi paralel lebih cocok pada saat thread 32. # Pengukuran Kinerja -| N | Size | 1 | 2 | 3 | avg | -|---|------|-------|---|---|-----| -| 1 | 5000 | 15145 | 15131 | 15273 | 15183 | -| 2 | 5000 | 40787 | 11316 | 5893 | 19332 | -| 1 | 50000| 187103| 148275| 105336 | 146904 | -| 2 | 50000| 89551 | 130345| 119153 | 113016 | -| 1 |100000| 224312|154683 |154609 |177868 | -| 2 |100000| 217054|197716|150975|188581 | -| 1 |200000|621111|629161|706030|652100 | -| 2 |200000|304229|358362|302638|321743 | -| 1 |400000|1142259|728879|1230207|1033781 | -| 2 |400000|1339009|1217159|1199709|1251959 | +Pada pengukuran ini kami membandingkan program radix sort paralel di cuda dengan program radix sort serial di cuda + +| Jenis | Size | 1 | 2 | 3 | +|---|------|-------|---|---| +| paralel | 5000 | 243994 | 243994 | 244032 | +| serial | 5000 | 179938 | 181242 | 181150 | +| paralel | 50000| 229224| 215969| 215769 | +| serial | 50000| 1807999 | 1784899| 1807166 | +| paralel |100000| 3588490|3.553063 |3553063 | +| serial |100000| 217054|197716|150975| +| paralel |200000|172296|170046|171914| +| serial |200000|3757676|4537993|3835774| +| paralel |400000|337847|366193|335076| +| serial |400000|6430453|5501653|5491221| +*perhitungan waktu dalam microsecond # Analisis Pengukuran Kinerja -Dari data kinerja diatas, sebenarnya kami lebih cenderung merasa bahwa faktor terbesar berkurangnya waktu bukanlah jumlah thread yang digunakan, tapi bagaimana kondisi cache dari prosesor. Walaupun dari data diatas dapat kita temukan perbedaan, tapi perbedaan tersebut sifatnya random dan tidak memiliki arah yang jelas. Oleh karena itu setiap pengurangan waktu yang terjadi ketika jumlah thread ditambahkan (atau penambahan waktu) lebih cenderung disebabkan oleh kondisi cache pada saat itu. - -Tapi karena radix sort parallel jauh lebih unggul ketika jumlah data banyak maka mungkin saja penurunan drastis yang terjadi ketika menggunakan dua thread ketika size = 200000 disebabkan oleh penggunaan parallel programming dan bukan kondisi cache saja. - +Dari hasil pengukuran diatas dapat kita lihat bahwa radix sort paralel dengan cuda lebih cepat dari pada radix sort secara serial. Selain itu dengan bertambahnya ukuran array maka kecepatan radix sort paralel makin lebih cepat dari serial. \ No newline at end of file