CoAtNet Family
| model | params (m) | pretrain | finetune | GFLOPs | Top-1 |
|---|---|---|---|---|---|
| CoAtNet-0 | 25.0 | IN-1k : Sup. : 300 | — : — : — | 4.2 | 81.6 |
| CoAtNet-0 | 25.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 384 | 13.4 | 83.9 |
| CoAtNet-1 | 42.0 | IN-1k : Sup. : 300 | — : — : — | 8.4 | 83.3 |
| CoAtNet-1 | 42.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 384 | 27.4 | 85.1 |
| CoAtNet-2 | 75.0 | IN-1k : Sup. : 300 | — : — : — | 15.7 | 84.1 |
| CoAtNet-2 | 75.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 384 | 49.8 | 85.7 |
| CoAtNet-2 | 75.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 512 | 96.7 | 85.9 |
| CoAtNet-2 | 75.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 384 | 49.8 | 87.1 |
| CoAtNet-2 | 75.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 512 | 96.7 | 87.3 |
| CoAtNet-3 | 168.0 | IN-1k : Sup. : 300 | — : — : — | 34.7 | 84.5 |
| CoAtNet-3 | 168.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 384 | 107.4 | 85.8 |
| CoAtNet-3 | 168.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 512 | 203.1 | 86.0 |
| CoAtNet-3 | 168.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 384 | 107.4 | 87.6 |
| CoAtNet-3 | 168.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 512 | 203.1 | 87.9 |
| CoAtNet-3 | 168.0 | JFT-300M : Sup. : 14 | IN-1k : 30 : 384 | 114.0 | 88.52 |
| CoAtNet-3 | 168.0 | JFT-300M : Sup. : 14 | IN-1k : 30 : 512 | 214.0 | 88.81 |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 384 | 189.5 | 87.9 |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 512 | 360.9 | 88.1 |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 384 | 189.5 | 88.3 |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 512 | 360.9 | 88.4 |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 150 | IN-1k : 30 : 384 | 189.5 | 88.4 |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 150 | IN-1k : 30 : 512 | 360.9 | 88.56 |
| CoAtNet-4 | 275.0 | JFT-300M : Sup. : 14 | IN-1k : 30 : 512 | 361.0 | 89.11 |
| CoAtNet-5 | 688.0 | JFT-300M : Sup. : 14 | IN-1k : 30 : 512 | 812.0 | 89.77 |
| CoAtNet-6 | 1470.0 | JFT-3B : Sup. : 14 | IN-1k : 30 : 512 | 1521.0 | 90.45 |
| CoAtNet-7 | 2440.0 | JFT-3B : Sup. : 14 | IN-1k : 30 : 512 | 2586.0 | 90.88 |
| model | params (m) | pretrain | finetune | gflops | IN-1k |
|---|---|---|---|---|---|
| CoAtNet-0 | 25.0 | IN-1k : Sup. : 300 | — : — : — | 4.2 | 81.6/— |
| CoAtNet-0 | 25.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 384 | 13.4 | 83.9/— |
| CoAtNet-1 | 42.0 | IN-1k : Sup. : 300 | — : — : — | 8.4 | 83.3/— |
| CoAtNet-1 | 42.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 384 | 27.4 | 85.1/— |
| CoAtNet-2 | 75.0 | IN-1k : Sup. : 300 | — : — : — | 15.7 | 84.1/— |
| CoAtNet-2 | 75.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 384 | 49.8 | 85.7/— |
| CoAtNet-2 | 75.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 512 | 96.7 | 85.9/— |
| CoAtNet-2 | 75.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 384 | 49.8 | 87.1/— |
| CoAtNet-2 | 75.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 512 | 96.7 | 87.3/— |
| CoAtNet-3 | 168.0 | IN-1k : Sup. : 300 | — : — : — | 34.7 | 84.5/— |
| CoAtNet-3 | 168.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 384 | 107.4 | 85.8/— |
| CoAtNet-3 | 168.0 | IN-1k : Sup. : 300 | IN-1k : 30 : 512 | 203.1 | 86.0/— |
| CoAtNet-3 | 168.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 384 | 107.4 | 87.6/— |
| CoAtNet-3 | 168.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 512 | 203.1 | 87.9/— |
| CoAtNet-3 | 168.0 | JFT-300M : Sup. : 14 | IN-1k : 30 : 384 | 114.0 | 88.52/— |
| CoAtNet-3 | 168.0 | JFT-300M : Sup. : 14 | IN-1k : 30 : 512 | 214.0 | 88.81/— |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 384 | 189.5 | 87.9/— |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 512 | 360.9 | 88.1/— |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 384 | 189.5 | 88.3/— |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 90 | IN-1k : 30 : 512 | 360.9 | 88.4/— |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 150 | IN-1k : 30 : 384 | 189.5 | 88.4/— |
| CoAtNet-4 | 275.0 | IN-22k : Sup. : 150 | IN-1k : 30 : 512 | 360.9 | 88.56/— |
| CoAtNet-4 | 275.0 | JFT-300M : Sup. : 14 | IN-1k : 30 : 512 | 361.0 | 89.11/— |
| CoAtNet-5 | 688.0 | JFT-300M : Sup. : 14 | IN-1k : 30 : 512 | 812.0 | 89.77/— |
| CoAtNet-6 | 1470.0 | JFT-3B : Sup. : 14 | IN-1k : 30 : 512 | 1521.0 | 90.45/— |
| CoAtNet-7 | 2440.0 | JFT-3B : Sup. : 14 | IN-1k : 30 : 512 | 2586.0 | 90.88/— |