Non è possibile, tra l'altro va definito cosa intendi per contare, se deve solo incrementare un registro da uno a un miliardo lo conta 4 volte in un secondo una CPU a 4GHZ che fa solo quello e impiega un ciclo per completare ogni istruzione inc eax
Ma nella realtà la cpu è condivisa da più thread e processi quindi l'OS può "mettere in pausa" la tua esecuzione per qualche microsecondo in base a quanto lavoro deve sostenere, falsando i benchmark. Inoltre la tua implementazione non sarà mai di una sola istruzione, ci devono essere jump, condizione di uscita dal loop ecc.