Heedless Backbones

FAN (Fully Attentional Networks) Family

Select an option
Results
Parameters (M)
Images / Second
Publication Date
Select an option
---------
Object Detection
Instance Segmentation
Classification
Semantic Segmentation
Panoptic Segmentation
Select an option
---------
ImageNet-1k
ImageNet-A
ImageNet-R
ImageNet-Sketch
ImageNet-C
ImageNet-C-bar
ImageNet-V2
ImageNet-ReaL
PASCAL VOC 2007 (val)
PASCAL VOC 2007 (test)
Select an option
----------
Top-1
Top-5
GFLOPs
Select an option
----------
224x224
384x384
512x512
Select an option
Results
Parameters (M)
Images / Second
GFLOPs
Publication Date
Select an option
---------
MegData73M
JFT-3B
JFT-300M
ImageNet-1k
ImageNet-22k
Select an option
----------
Supervised
Sup. + TL
FCMAE
MAE
CL
Select an option
Family
Pretrain Dataset
Classification Resolution
Select an option
----------
Family
Pretrain Method
Classification Resolution
modelparams (m)pretrainfinetuneGFLOPsTop-1
FAN-T-ViT7.0IN-1k : Sup. : 300— : — : —1.379.2
FAN-T-Hybrid7.0IN-1k : Sup. : 300— : — : —3.580.1
FAN-S-ViT28.0IN-1k : Sup. : 300— : — : —5.382.9
FAN-S-Hybrid26.0IN-1k : Sup. : 300— : — : —6.783.5
FAN-B-ViT54.0IN-1k : Sup. : 300— : — : —10.483.6
FAN-B-Hybrid50.0IN-1k : Sup. : 300— : — : —11.383.9
FAN-B-Hybrid50.0IN-22k : Sup. : 90IN-1k : 30 : 22411.385.6
FAN-L-ViT81.0IN-1k : Sup. : 300— : — : —15.883.9
FAN-L-Hybrid76.8IN-1k : Sup. : 300— : — : —16.984.3
FAN-L-Hybrid76.8IN-22k : Sup. : 90IN-1k : 30 : 22416.986.5
modelparams (m)pretrainfinetunegflopsIN-1kIN-C↓IN-AIN-R
FAN-T-ViT7.0IN-1k : Sup. : 300— : — : —1.379.2/——/——/——/—
FAN-T-Hybrid7.0IN-1k : Sup. : 300— : — : —3.580.1/——/——/——/—
FAN-S-ViT28.0IN-1k : Sup. : 300— : — : —5.382.9/—47.7/—29.1/—50.4/—
FAN-S-Hybrid26.0IN-1k : Sup. : 300— : — : —6.783.5/—47.8/—33.9/—50.7/—
FAN-B-ViT54.0IN-1k : Sup. : 300— : — : —10.483.6/—44.4/—35.4/—51.8/—
FAN-B-Hybrid50.0IN-1k : Sup. : 300— : — : —11.383.9/—45.2/—39.6/—52.9/—
FAN-B-Hybrid50.0IN-22k : Sup. : 90IN-1k : 30 : 22411.385.6/——/——/——/—
FAN-L-ViT81.0IN-1k : Sup. : 300— : — : —15.883.9/—43.3/—37.2/—53.1/—
FAN-L-Hybrid76.8IN-1k : Sup. : 300— : — : —16.984.3/—43.0/—41.8/—53.2/—
FAN-L-Hybrid76.8IN-22k : Sup. : 90IN-1k : 30 : 384None87.1/—36.0/—74.5/—71.1/—
FAN-L-Hybrid76.8IN-22k : Sup. : 90IN-1k : 30 : 22416.986.5/—35.8/—60.7/—64.3/—

COCO (val)

modelpretrainheadtraingflopsmAPbAPb50APb75mAPbsmAPbmmAPbl
FAN-T-HybridIN-1k : Sup. : 300Mask R-CNNCOCO (train) : 36None45.8
FAN-T-HybridIN-1k : Sup. : 300Cascade Mask R-CNNCOCO (train) : 36None50.2
FAN-S-HybridIN-1k : Sup. : 300Mask R-CNNCOCO (train) : 36None49.1
FAN-S-HybridIN-1k : Sup. : 300Cascade Mask R-CNNCOCO (train) : 36None53.3
FAN-B-HybridIN-1k : Sup. : 300Cascade Mask R-CNNCOCO (train) : 36None53.3
FAN-B-HybridIN-22k : Sup. : 90Cascade Mask R-CNNCOCO (train) : 36None40.6
FAN-L-HybridIN-1k : Sup. : 300Cascade Mask R-CNNCOCO (train) : 36None54.1
FAN-L-HybridIN-22k : Sup. : 90Cascade Mask R-CNNCOCO (train) : 36None55.1

Cityscapes (val)

modelpretrainheadtraingflopsmIoUmspAccmsmAccmsmIoUsspAccssmAccss
FAN-T-HybridIN-1k : Sup. : 300SETRCityscapes (train) : 128 : 1024None81.2
FAN-S-HybridIN-1k : Sup. : 300SETRCityscapes (train) : 128 : 1024None81.5
FAN-B-HybridIN-1k : Sup. : 300SETRCityscapes (train) : 128 : 1024None82.2
FAN-L-HybridIN-1k : Sup. : 300SETRCityscapes (train) : 128 : 1024None82.3