Plotki na temat zestawu Vision Pro krążą od lat, ale nigdy nie było do końca jasne jak będzie on kontrolowany. Pojawiły się wczesne pogłoski o urządzeniach sterujących, które ostatecznie zniknęły, gdy przecieki skupiły się bardziej na sterowaniu gestami i jak się okazuje to jest kierunek w jaki poszedł Apple.
Vision Pro wykorzystuje do nawigacji gesty dłoni, ruchy oczu i polecenia głosowe. Można na przykład wybrać coś na wyświetlaczu, patrząc na to, a następnie stukając palcami. Przewijanie odbywa się szybkim ruchem i wymagane są tylko niewielkie ruchy. Można spojrzeć na przycisk mikrofonu w polu wyszukiwania, a następnie zacząć mówić, aby podyktować tekst, a do otwierania i zamykania aplikacji, odtwarzania utworów i innych funkcji można używać poleceń głosowych Siri.
Recenzenci stwierdzili, że przyzwyczajenie się do nawigacji Vision Pro wymaga czasu. Większość innych zestawów AR/VR dostępnych na rynku wykorzystuje jakiś ręczny mechanizm sterujący, więc system sterowania oparty na gestach będzie nieznany prawie każdemu.
Pisanie można wykonać za pomocą podłączonego iPhone’a lub klawiatury Bluetooth, ale jest też wirtualna klawiatura do pisania, a alternatywnie można użyć dyktowania.
Interfejs nie będzie łatwy do przyzwyczajenia się, ale plusem jest układ aplikacji i nawigacja, która dla osób korzystających z iPhone’a czy iPada będzie natychmiast rozpoznawalna. Aplikacje są ułożone w „Widoku głównym”, który jest podobny do ekranu głównego, więc nie wszystko będzie całkiem nowe.