Base64-koodauskirjasto Arduinon kanssa

Base64-koodauskirjasto Arduinon kanssa

Base64-koodauskirjasto Arduinon kanssa

BASE64 on koodausjärjestelmä, joka käyttää 64 symbolia, jotka on ryhmitelty viesteiksi, joiden pituus on neljän kerrannainen. Nämä viestit (datapaketit) täydennetään tarvittaessa plussymbolilla (joten käytetään 65), usein yhtäläisyysmerkkiä (=), jos koodattu hyödyllinen tieto johtaa lyhyempään pituuteen.

Sisällysluettelo

    Käyttämällä 64 merkkiä voit käsitellä koodin 10 numeroa sekä isoja ja pieniä kirjaimia (26+26) ASCII, ongelmana on, että on olemassa 62 yksiselitteistä symbolia plus kaksi, jotka vaihtelevat eri toteutuksissa. Vaikka joskus viitataan ilmaisulla "hahmot". ASCII tulostettava", todellisuudessa ne ovat niitä, jotka vaihtelevat koodin 32 (välilyönti) edustamasta numerosta 126 (~) todella tulostettavaan 95:een.

    Koodauksen toteuttaminen BASE64 eniten käytetty, että PEM, jota myös käyttää MIME, käytä ylimääräisiä "+"- ja "/"-merkkejä sekä "="-merkkiä, jotta pakettien pituus on neljän kerrannainen. Kirjaimet A-Z ovat paikoissa 0-25, kirjaimet a-z ovat paikkoja 26-51, numerot 0-9 ovat paikkoja 52-61, plusmerkki (+) ovat 62 ja 63 on kauttaviiva (/ ).

    Tapa esittää tiedot muodossa BASE64 koostuu ryhmien ottamisesta alkuperäisistä tiedoista 6 bittiä jotka esitetään vastaavalla koodilla. Jos bittejä on jäljellä, ne täytetään nollilla oikealla. Jos saatu koodien määrä ei ole neljän kerrannainen, se täytetään yhtäläisyysmerkeillä oikealla.

    Seuraava kuva näyttää koodauksen ASCII tekstistä ("ohm") ja tavasta, jolla se muunnetaan BASE64. Koska symboleja on 7, viimeinen viesti on täytettävä yhtäläisyysmerkillä. Voisi sanoa, että teksti "ohm" sisään ASCII vastaa «b2htaW8=" in BASE64.

    Esimerkki Base64-koodauksesta

    Koodauksen erityiskäyttö BASE64 Ne myös yleensä määräävät enimmäislinjan pituuden. Toimeenpano MIME Rajoittaa jokaisen rivin 76 merkkiin. Normaalisti rivit erotetaan rivin loppukoodilla (CR, jota edustaa arvo 0x0D ASCII) ja toinen uusi rivi (NL, joka vastaa koodia ASCII 0x0A).

    Epämukavuus, joka lisätään koodauksen käyttöönotossa BASE64 laitteella, jolla on vähän resursseja, kuten usein a mikro-ohjain on, että sinun on koodattava tiedon saapuessa tai a puskuri minimi, mikä edellyttää myös sellaisen järjestelmän tarjoamista, joka ilmoittaa, että alkuperäisen viestin loppu on saavutettu esimerkiksi lisäämällä erikoiskoodi tai käyttämällä PIN-koodia, jonka taso (vastaanoton kanssa synkronoituna) ilmaisee viestin tilan.

    Alla oleva esimerkkikoodi on a kirjasto Arduinolle Base64:ään koodattavaksi joka toteutetaan molemmilla kriteereillä: saapuvan tiedon koodauksella (ilman a puskuri) ja odota varoitussignaalin loppumista.

    Koodilaskennan perusosa BASE64 Se tehdään lausekkeella:
    (valor_original>>(2+(numero_valor%3)*2))|resto_base64
    ja lopun laskeminen lausekkeella:
    (valor_original&(MASCARA_B64>>desplazamiento))<<desplazamiento,
    ollessa desplazamiento arvo, joka lasketaan lausekkeella:
    4-(numero_valor%3)*2

    Näiden lausekkeiden saamiseksi noudatettava prosessi koostuu kunkin neljän koodin laskennan yleistämisestä BASE64 jotka johtuvat edustamalla kolme tavua alkuperäisestä arvosta.

    Base64=((byte_1>>2)|resto)&0b00111111 resto=(byte_1&0b00000011)<<4
    Base64=((byte_2>>4)|resto)&0b00111111 resto=(byte_2&0b00001111)<<2
    Base64=((byte_3>>6)|resto)&0b00111111 resto=(byte_3&0b00111111)<<0
    Base64=((byte_3>>0)|resto)&0b00111111 resto=(byte_3&0b00111111)<<0

    Tekstin kanssa Base64 Yllä oleva pseudokoodi viittaa koodiin BASE64 jota lasketaan. Ilmaisua on käytetty byte_n viitata koodattavaan n:nneen tavuun. Teksti resto edustaa koodattavan tavun jäljellä olevia bittejä. Laskennan alussa oletetaan, että jäännös on nolla

    Selvyyden vuoksi edellisessä pseudokoodissa 6-bittinen maski on sisällytetty kaikkien koodien laskemiseen, vaikka on tarpeen määrittää vain niistä viimeinen, koska muut on kierretty niin, että kaksi eniten bittiä menetetään aina. merkittävä.

    Kuten voidaan nähdä, neljäs koodi on kaikki jäännös, eikä jäännöstä tarvitse laskea jälkeenpäin; Siksi on tarpeen suorittaa vain kolme vaihetta, yksi per koodattu tavu. On tärkeää muistaa, että jos paketin kolmatta tavua ei ole koodattu, viimeinen koodi on täytettävä nolilla oikealla. BASE64 saatu.

    Yleistyksenä: koodin laskevan lausekkeen oikea kierto BASE64 voidaan esittää muodossa 2+(numero_byte%3)*2 niin, että sulkujen sisällä oleva osa kiertyy nollasta kahteen, jolloin tuloksena olisi 2, 4 ja 6 jokaisessa vaiheessa. Se ei tietenkään ole ainoa tapa yleistää, mutta olen valinnut tämän toiminnallisuuden ja ennen kaikkea selkeyden vuoksi. Koska maski (AND) oli välttämätön vain neljännessä koodissa ja on jo nähty, että sitä ei tarvitse laskea (se on kaikki jäännös), sitä ei sisällytetä lopulliseen lausekkeeseen sen yksinkertaistamiseksi, vaikka meidän täytyy muistaa että käytetystä datatyypistä (tavu ) otetaan vain 6 vähiten merkitsevää bittiä.

    Loput vasemmalle voidaan yleistää edellistä vastaavalla tavalla. Voidaan myös nähdä, että levitettävä maski (AND) käy läpi saman bittikierron, mutta vastakkaiseen suuntaan. Tästä syystä siirtymä lasketaan 4-(numero_valor%3)*2 ennen kuin käytät sitä lauseen kutakin osaa vastaavassa merkityksessä.

    Seuraava esimerkki näyttää, kuinka kirjastoa käytetään tekstimerkkijonon koodaamiseen (muista tämä BASE64 voidaan käyttää mille tahansa tietojoukolle, kuten kuvalle). Seuraavassa koodissa on pari yksityiskohtaa, joita on mielenkiintoista selventää. Ensinnäkin erityistä symbolia (symbolia ~) on käytetty osoittamaan tekstin loppua laitteistosignaalin tai tekstin pituuden osoittavan sijaan. Loogisesti tämä symboli ei voi olla osa koodattua dataa.

    Toinen asia, joka on otettava huomioon, niin tärkeä kuin se onkin, on se, että kohteen dekooderin on tiedettävä, kuinka sen saavuttava tieto esitetään. Teksti sisältää merkkejä, jotka eivät kuulu joukkoon ASCII tulostettavat (32-126), esimerkiksi aksenttikirjaimet. Työläs käyttää kahta tavua (UTF-8) edustamaan näitä merkkejä. Tavallista ei voi yksinkertaisesti käyttää \0 tekstin päätteeksi, koska monissa tapauksissa ensimmäinen tavu, jolla merkki esitetään, on täsmälleen nolla.

    Edellisen esimerkin rivillä 26 näkyy kirjasto Arduinolle Base64:ään koodattavaksi. On tarpeen ilmoittaa vain menetelmä convertir jokainen tavu jonka haluat koodata ja valinnaisesti onko se viimeinen tai jos ei, lopeta muunnos menetelmällä terminar kun tulet loppuun.

    Kuten alla olevasta kuvakaappauksesta näkyy, esimerkkiohjelma kirjasto Arduinolle Base64:ään koodattavaksi näyttää ensin tekstin, johon koodataan BASE64, tässä tapauksessa kuuluisan jättiläisten laulun alku Les Luthiers, ja sen jälkeen koodauksen tulos BASE64 käyttämällä muotoa rivin pituus MIME.

    Base64-koodaus Arduinolla. Tekstin muunnostulosesimerkki

    Post Comment

    Olet ehkä missannut