RSA-cryptosystemen

Een geheimschrift kun je maken door een permutatie van de 26 letters van het alfabet te nemen, bijvoorbeeld

Het coderen van een tekst bestaat dan uit het toepassen van de permutatie op de letters in de tekst. Het resultaat kan men decoderen door er de inverse permutatie op los te laten. Is de permutatie gegeven zoals hierboven, dan is coderen een tikkeltje eenvoudiger dan decoderen. Bij het decoderen moet men de letters in de onderste rij opzoeken en ze staan daar niet in de gebruikelijke alfabetische volgorde. Is de gehanteerde code niet bekend, dan is het decoderen een stuk moeilijker, maar met enig proberen is er wel uit te komen als men over een voldoend lange gecodeerde tekst beschikt. We zullen in deze paragraaf een geheimschrift beschrijven, waarbij het decoderen een onmogelijke opgave is, zelfs al kent men de gehanteerde code. Dit is niet zo vreemd als het misschien lijkt: permuteert men niet de 26 letters van het alfabet, maar bijvoorbeeld alle woorden van de Nederlandse taal, en geeft men deze permutatie door in een woordenboek achter ieder woord z’n gecodeerde versie te noteren, dan is het terugzoeken een monnikenwerk. Maar tegenwoordig hebben we computers en die zijn heel goed in terugzoeken. We zullen een permutatie beschrijven van zo’n

1 0^{200}

objecten, waarbij het terugzoeken met een computer alleen met succes kan geschieden als men over extra informatie beschikt.

Alle tekens die we in een tekst willen gebruiken kunnen we op een standaard manier vervangen door getallen. We kunnen daarvoor bijvoorbeeld de ascii-code gebruiken. In de binaire notatie zijn dan 8 digits per teken nodig (8 binary digits = 8 bits = 1 byte). Op deze manier is een tekst op een standaard manier om te zetten in een (groot) getal door alle digits achter elkaar te plaatsen. Het coderen bestaat nu uit een permutatie van alle natuurlijke getallen die kleiner zijn dan een gegeven groot getal. Dit grote getal is in de orde van

1 0^{200}

. Het komt er op neer dat we een permutatie krijgen van alle mogelijke teksten met de lengte van ongeveer een normale regel.

We beschrijven eerst het coderen. De code is afhankelijk van twee grote priemgetallen

p

q

, beide in de orde van

1 0^{100}

. Er zijn zeer veel van zulke priemgetallen en ze zijn met een computer niet moeilijk te vinden, vooral als je geen absolute zekerheid nastreeft. De test van Rabin is hiervoor zeer geschikt. Deze priemgetallen houden we geheim, hun product

m

niet. De code is een permutatie van

ℤ_{m}

. Een representantensysteem is

ℕ_{m}

, de verzameling van alle natuurlijke getallen kleiner dan

m

. We kiezen een getal

e

zo dat

ggd (e, φ (m)) = 1

. Er geldt

φ (m) = (p - 1) (q - 1)

, maar anderen weten dat niet, want die weten niet hoe

m

te ontbinden. De code is de volgende permutatie van

ℤ_{m}

(tot de macht

e

verheffen). Deze transformatie is een permutatie omdat hij een inverse heeft: omdat

ggd (e, φ (m)) = 1

, zijn er

f, n \in ℤ

zo dat

e f + φ (m) n = 1

μ_{f}

(tot de macht

f

verheffen) is de inverse, immers voor

x \in ℤ_{m}^{*}

geldt

en met behulp van de Chinese reststelling is het niet moeilijk om in te zien dat zelfs

μ_{f} μ_{e} (x) = x

voor alle

x \in ℤ_{m}

(en niet alleen in

ℤ_{m}^{*}

). Het decoderen is dus tot de macht

f

verheffen. Kent men

p

q

, dan kent men ook

φ (m)

en dan is

f

eenvoudig te bepalen met behulp van het uitgebreide algoritme van Euclides. Kent men alleen

m

e

, dan kan men coderen, maar wil men kunnen decoderen, dan zit er weinig anders op dan

m

te factoriseren, en met de huidige kennis en hardware zijn daar naar verwachting duizenden jaren mee gemoeid. De hier beschreven code noemt men de RSA-code naar de uitvinders ervan: Rivest, Shamir en Adleman. Dat deze code voldoet berust enerzijds op het feit dat we tot veel in staat zijn (het herkennen van grote priemgetallen), en anderzijds dat ons kunnen slechts beperkt is (grote getallen kunnen we niet ontbinden).

Een eenvoudig RSA-cryptosysteem met Python

De ascii-code van de tekens op een normaal toetsenbord varieert van $32$ tot $126$ . Trek je daar $32$ van af, dan is zo’n teken te representeren door een getal met twee cijfers. We gaan dit gebruiken voor het vertalen van strings in lists van getallen en terug.

Gebruiken we strings van lengte $l$ , dan leveren die getallen van lengte $2 l$ . We bepalen random priemgetallen $p$ en $q$ van lengte (= lengte van de decimale representatie) $l$ zodat hun product $m = p q$ (niet al teveel) groter is dan $1 0^{2 l}$ . Vervolgens bepalen we een random $e$ met $ggd (e, (p - 1) (q - 1)) = 1$ en met het uitgebreide algoritme van Euclides de $f$ die nodig is voor het decoderen. We voegen de functie makersa(l) toe.

:   def makersa(l):
      p = next_rabin_prime(random.randint(10**(l - 1), 9 * \
      (10**(l - 1))), 20)
      q = next_rabin_prime(random.randint((10**(2 * l)) / p,
      (10**(2 * l)) / p + (10**(l - 1))), 20)
      m = p * q
      e = random.randint(10**(2 * l - 1), 9 * (10**(2 * l - 1)))
      while gcd(e, (p - 1) * (q - 1))>1:
          e = e + 1
      f = modinv(e, (p - 1) * (q - 1))
      return (l, m, e), (l, m, f), (p, q)

De functie makersa(l) geeft als resultaat $((l, m, e), (l, m, f), p, q)$ . Daarbij is $(l, m, e)$ een code die te gebruiken is voor het coderen van strings van lengte $l$ . Met de code $(l, m, f)$ kan dan worden gedecodeerd. Andersom kan net zo goed. De getallen $p$ en $q$ worden erbij geleverd, maar zijn niet nodig voor het cryptosysteem.

We werken met strings van willekeurige lengte en alleen met de tekens van het toetsenbord (ascii-code van $32$ t/m $126$ , die we met $32$ verlagen). In het bijzonder werken we hier zonder regelafbreking. Verfijningen kunnen natuurlijk worden aangebracht, maar het gaat hier om het principe.

Het coderen van een string s gaat nu zo:

Maak van $s$ een list van tekens.
Zet deze lijst om in een lijst getallen: neem ascii-code minus $32$ .
Maak daar een groot getal van.
Hak dit op in cijferstrings van lengte $l$ (de laatste aangevuld met nullen).
Transformeer elk van de getallen met de code (l,m,e).

Het resultaat is een lijst getallen.

:   def transform(nrlist, a, n):
      return [pow(nr, a, n) for nr in nrlist]

  def encode_rsa(s, code):
      def number(c): return ord(c) - 32
      def str2(n): return str(n).zfill(2)
      def codenumber(s):
          return int(’’.join(map(str2, map(number,list(s)))))
      def codenrs(lst): return [codenumber(s) for s in lst]
      return transform(codenrs([s[code[0] * i:code[0] * (i + 1)]
      .ljust(code[0]) for i in range(len(s)/code[0] + 1)]),
      code[2], code[1])

Het decoderen van de list cijferstrings nrlst gebeurt in omgekeerde volgorde:

Transformeer elk van de getallen met de code (l,m,f).
Voeg de getallen samen tot één groot getal.
Maak er een lijst getallen van bestaande uit $2$ cijfers.
Bepaal bij elk van die getallen het teken met ascii-code dat getal plus $32$ .
Maak er één grote string van.

Het resultaat is de oorspronkelijke string s (aangevuld met een aantal spaties als gevolg van het ophakken in woorden van dezelfde lengte).

:   def decode_rsa(nrlst, code):
      def char(n):
          if n>94: return r’ ’
          else: return chr(n + 32)
      def phrase(codenr, N):
          nrstr = str(codenr).zfill(N)
          return ’’.join(map(char,map(int, [nrstr[2 * i:2 * i + 2]
          for i in range(len(nrstr) / 2)])))
      def phrases(nrlst, N):
          return [phrase(nr, N) for nr in nrlst]
      return r’’.join(phrases(transform(nrlst,code[2],code[1]),
      2*code[0]))

Gebruik je een code die gemaakt is met priemgetallen van lengte $15$ , dan is hij makkelijk te kraken. In onderstaand voorbeeld ging dat met Pollard-rho in enkele minuten. Zulke priemgetallen zijn dus veel te klein.

  >>> rsa=makersa(15)
  >>> rsa
  ((15, 1076793425752016934817534394039L, 751537927195162228107676912
  199L), (15, 1076793425752016934817534394039L, 428170688654659395393
  699451487L), (847620309727837, 1270372374746147))
  >>> pollardrho(1076793425752016934817534394039L)
  1270372374746147L

We maken een code met priemgetallen van lengte $100$ .

  >>> rsa=makersa(100)
  >>> rsa
  ((100, 101176872763573454996004180157701256847969274885073551909148
  5169170675812792982484110998000962279060187186302166381364584401915
  2730498341890877040362930558600127782086805853013572386110346579293
  9447489L, 375002007858589050676281053588216213650373591197865584141
  5089403876618760601961352966017148816798680720510829480559359776182
  1330395964167716290626034620849120215139808106203171336515202844711
  649200151L), (100, 101176872763573454996004180157701256847969274885
  0735519091485169170675812792982484110998000962279060187186302166381
  3645844019152730498341890877040362930558600127782086805853013572386
  1103465792939447489L, 953492770639995186037453834553540244578450098
  7197736459709084341715922486328783852376822574298463043821147720495
  5542885564536634107702207872187679180825392732327273911221276890962
  82378252259042519991L),(1981576066909462110631352504720554800811072
  621251871013835820589512913411817256947518736708672416059L,51058788
  2308109295085377819446706808310631098800312097562306767104287188599
  44491271947424313703774771L))
  >>> encmesg=encode_rsa(r"Omdat we nog niet in staat zijn getallen v
  an 200 cijfers te ontbinden, is de RSA-code opgebouwd met twee prie
  mgetallen van 100 cijfers een veilige publieke code",rsa[0])
  >>> encmesg
  [835779495668009636607822103875712694898903486561245586828614232788
  1042409170337574797316332109566273557908883208230509090467710218541
  4226816696029766398179659551894633273674914258348692808970746646974
  L, 8163239024322204647219952769182230795745684086150389605961519785
  5695364180906099078089967574988922187428294740228578641236956546991
  5608585373855068389170140872232577109058981682341982876356933963708
  08L]
  >>> decode_rsa(encmesg,rsa[1])
  "Omdat we nog niet in staat zijn getallen van 200 cijfers te ontbin
  den, is de RSA-code opgebouwd met twee priemgetallen van 100 cijfer
  s een veilige publieke code
  "

13.5 RSA-cryptosystemen

Een eenvoudig RSA-cryptosysteem met Python