Skip to content
Snippets Groups Projects
Commit b77808cb authored by Dinda Yora Islami's avatar Dinda Yora Islami
Browse files

edit readme

parent 958ac715
Branches
No related merge requests found
......@@ -40,24 +40,24 @@ Setelah penulis menulis kode diatas, penulis menemukan banyak hal yang dapat die
# Jumlah Thread yang Digunakan
## 32
Ketika melakukan pengerjaan melalui komputer pribadi, kami menemukan bahwa jika nilai thread lebih dari 2, ada kemungkinan program MPI tersebut stuck. Walaupun hal ini tidak pernah kami temukan di komputer remote. Maka dari itu untuk mendapatkan data yang konsisten kami memutuskan untuk menggunakan 2 thread saja
Ketika melakukan pengerjaan kami menemukan bahwa program yang kami modifikasi menjadi paralel lebih cocok pada saat thread 32.
# Pengukuran Kinerja
| N | Size | 1 | 2 | 3 | avg |
|---|------|-------|---|---|-----|
| 1 | 5000 | 15145 | 15131 | 15273 | 15183 |
| 2 | 5000 | 40787 | 11316 | 5893 | 19332 |
| 1 | 50000| 187103| 148275| 105336 | 146904 |
| 2 | 50000| 89551 | 130345| 119153 | 113016 |
| 1 |100000| 224312|154683 |154609 |177868 |
| 2 |100000| 217054|197716|150975|188581 |
| 1 |200000|621111|629161|706030|652100 |
| 2 |200000|304229|358362|302638|321743 |
| 1 |400000|1142259|728879|1230207|1033781 |
| 2 |400000|1339009|1217159|1199709|1251959 |
Pada pengukuran ini kami membandingkan program radix sort paralel di cuda dengan program radix sort serial di cuda
| Jenis | Size | 1 | 2 | 3 |
|---|------|-------|---|---|
| paralel | 5000 | 243994 | 243994 | 244032 |
| serial | 5000 | 179938 | 181242 | 181150 |
| paralel | 50000| 229224| 215969| 215769 |
| serial | 50000| 1807999 | 1784899| 1807166 |
| paralel |100000| 3588490|3.553063 |3553063 |
| serial |100000| 217054|197716|150975|
| paralel |200000|172296|170046|171914|
| serial |200000|3757676|4537993|3835774|
| paralel |400000|337847|366193|335076|
| serial |400000|6430453|5501653|5491221|
*perhitungan waktu dalam microsecond
# Analisis Pengukuran Kinerja
Dari data kinerja diatas, sebenarnya kami lebih cenderung merasa bahwa faktor terbesar berkurangnya waktu bukanlah jumlah thread yang digunakan, tapi bagaimana kondisi cache dari prosesor. Walaupun dari data diatas dapat kita temukan perbedaan, tapi perbedaan tersebut sifatnya random dan tidak memiliki arah yang jelas. Oleh karena itu setiap pengurangan waktu yang terjadi ketika jumlah thread ditambahkan (atau penambahan waktu) lebih cenderung disebabkan oleh kondisi cache pada saat itu.
Tapi karena radix sort parallel jauh lebih unggul ketika jumlah data banyak maka mungkin saja penurunan drastis yang terjadi ketika menggunakan dua thread ketika size = 200000 disebabkan oleh penggunaan parallel programming dan bukan kondisi cache saja.
Dari hasil pengukuran diatas dapat kita lihat bahwa radix sort paralel dengan cuda lebih cepat dari pada radix sort secara serial. Selain itu dengan bertambahnya ukuran array maka kecepatan radix sort paralel makin lebih cepat dari serial.
\ No newline at end of file
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment