x86: move x86_cpu_to_apicid_init to smpboot.c
[linux-2.6] / crypto / sha256_generic.c
1 /*
2  * Cryptographic API.
3  *
4  * SHA-256, as specified in
5  * http://csrc.nist.gov/cryptval/shs/sha256-384-512.pdf
6  *
7  * SHA-256 code by Jean-Luc Cooke <jlcooke@certainkey.com>.
8  *
9  * Copyright (c) Jean-Luc Cooke <jlcooke@certainkey.com>
10  * Copyright (c) Andrew McDonald <andrew@mcdonald.org.uk>
11  * Copyright (c) 2002 James Morris <jmorris@intercode.com.au>
12  * SHA224 Support Copyright 2007 Intel Corporation <jonathan.lynch@intel.com>
13  *
14  * This program is free software; you can redistribute it and/or modify it
15  * under the terms of the GNU General Public License as published by the Free
16  * Software Foundation; either version 2 of the License, or (at your option) 
17  * any later version.
18  *
19  */
20 #include <linux/init.h>
21 #include <linux/module.h>
22 #include <linux/mm.h>
23 #include <linux/crypto.h>
24 #include <linux/types.h>
25 #include <crypto/sha.h>
26 #include <asm/byteorder.h>
27
28 struct sha256_ctx {
29         u32 count[2];
30         u32 state[8];
31         u8 buf[128];
32 };
33
34 static inline u32 Ch(u32 x, u32 y, u32 z)
35 {
36         return z ^ (x & (y ^ z));
37 }
38
39 static inline u32 Maj(u32 x, u32 y, u32 z)
40 {
41         return (x & y) | (z & (x | y));
42 }
43
44 #define e0(x)       (ror32(x, 2) ^ ror32(x,13) ^ ror32(x,22))
45 #define e1(x)       (ror32(x, 6) ^ ror32(x,11) ^ ror32(x,25))
46 #define s0(x)       (ror32(x, 7) ^ ror32(x,18) ^ (x >> 3))
47 #define s1(x)       (ror32(x,17) ^ ror32(x,19) ^ (x >> 10))
48
49 static inline void LOAD_OP(int I, u32 *W, const u8 *input)
50 {
51         W[I] = __be32_to_cpu( ((__be32*)(input))[I] );
52 }
53
54 static inline void BLEND_OP(int I, u32 *W)
55 {
56         W[I] = s1(W[I-2]) + W[I-7] + s0(W[I-15]) + W[I-16];
57 }
58
59 static void sha256_transform(u32 *state, const u8 *input)
60 {
61         u32 a, b, c, d, e, f, g, h, t1, t2;
62         u32 W[64];
63         int i;
64
65         /* load the input */
66         for (i = 0; i < 16; i++)
67                 LOAD_OP(i, W, input);
68
69         /* now blend */
70         for (i = 16; i < 64; i++)
71                 BLEND_OP(i, W);
72     
73         /* load the state into our registers */
74         a=state[0];  b=state[1];  c=state[2];  d=state[3];
75         e=state[4];  f=state[5];  g=state[6];  h=state[7];
76
77         /* now iterate */
78         t1 = h + e1(e) + Ch(e,f,g) + 0x428a2f98 + W[ 0];
79         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
80         t1 = g + e1(d) + Ch(d,e,f) + 0x71374491 + W[ 1];
81         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
82         t1 = f + e1(c) + Ch(c,d,e) + 0xb5c0fbcf + W[ 2];
83         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
84         t1 = e + e1(b) + Ch(b,c,d) + 0xe9b5dba5 + W[ 3];
85         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
86         t1 = d + e1(a) + Ch(a,b,c) + 0x3956c25b + W[ 4];
87         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
88         t1 = c + e1(h) + Ch(h,a,b) + 0x59f111f1 + W[ 5];
89         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
90         t1 = b + e1(g) + Ch(g,h,a) + 0x923f82a4 + W[ 6];
91         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
92         t1 = a + e1(f) + Ch(f,g,h) + 0xab1c5ed5 + W[ 7];
93         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
94
95         t1 = h + e1(e) + Ch(e,f,g) + 0xd807aa98 + W[ 8];
96         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
97         t1 = g + e1(d) + Ch(d,e,f) + 0x12835b01 + W[ 9];
98         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
99         t1 = f + e1(c) + Ch(c,d,e) + 0x243185be + W[10];
100         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
101         t1 = e + e1(b) + Ch(b,c,d) + 0x550c7dc3 + W[11];
102         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
103         t1 = d + e1(a) + Ch(a,b,c) + 0x72be5d74 + W[12];
104         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
105         t1 = c + e1(h) + Ch(h,a,b) + 0x80deb1fe + W[13];
106         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
107         t1 = b + e1(g) + Ch(g,h,a) + 0x9bdc06a7 + W[14];
108         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
109         t1 = a + e1(f) + Ch(f,g,h) + 0xc19bf174 + W[15];
110         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
111
112         t1 = h + e1(e) + Ch(e,f,g) + 0xe49b69c1 + W[16];
113         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
114         t1 = g + e1(d) + Ch(d,e,f) + 0xefbe4786 + W[17];
115         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
116         t1 = f + e1(c) + Ch(c,d,e) + 0x0fc19dc6 + W[18];
117         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
118         t1 = e + e1(b) + Ch(b,c,d) + 0x240ca1cc + W[19];
119         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
120         t1 = d + e1(a) + Ch(a,b,c) + 0x2de92c6f + W[20];
121         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
122         t1 = c + e1(h) + Ch(h,a,b) + 0x4a7484aa + W[21];
123         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
124         t1 = b + e1(g) + Ch(g,h,a) + 0x5cb0a9dc + W[22];
125         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
126         t1 = a + e1(f) + Ch(f,g,h) + 0x76f988da + W[23];
127         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
128
129         t1 = h + e1(e) + Ch(e,f,g) + 0x983e5152 + W[24];
130         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
131         t1 = g + e1(d) + Ch(d,e,f) + 0xa831c66d + W[25];
132         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
133         t1 = f + e1(c) + Ch(c,d,e) + 0xb00327c8 + W[26];
134         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
135         t1 = e + e1(b) + Ch(b,c,d) + 0xbf597fc7 + W[27];
136         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
137         t1 = d + e1(a) + Ch(a,b,c) + 0xc6e00bf3 + W[28];
138         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
139         t1 = c + e1(h) + Ch(h,a,b) + 0xd5a79147 + W[29];
140         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
141         t1 = b + e1(g) + Ch(g,h,a) + 0x06ca6351 + W[30];
142         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
143         t1 = a + e1(f) + Ch(f,g,h) + 0x14292967 + W[31];
144         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
145
146         t1 = h + e1(e) + Ch(e,f,g) + 0x27b70a85 + W[32];
147         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
148         t1 = g + e1(d) + Ch(d,e,f) + 0x2e1b2138 + W[33];
149         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
150         t1 = f + e1(c) + Ch(c,d,e) + 0x4d2c6dfc + W[34];
151         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
152         t1 = e + e1(b) + Ch(b,c,d) + 0x53380d13 + W[35];
153         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
154         t1 = d + e1(a) + Ch(a,b,c) + 0x650a7354 + W[36];
155         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
156         t1 = c + e1(h) + Ch(h,a,b) + 0x766a0abb + W[37];
157         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
158         t1 = b + e1(g) + Ch(g,h,a) + 0x81c2c92e + W[38];
159         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
160         t1 = a + e1(f) + Ch(f,g,h) + 0x92722c85 + W[39];
161         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
162
163         t1 = h + e1(e) + Ch(e,f,g) + 0xa2bfe8a1 + W[40];
164         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
165         t1 = g + e1(d) + Ch(d,e,f) + 0xa81a664b + W[41];
166         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
167         t1 = f + e1(c) + Ch(c,d,e) + 0xc24b8b70 + W[42];
168         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
169         t1 = e + e1(b) + Ch(b,c,d) + 0xc76c51a3 + W[43];
170         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
171         t1 = d + e1(a) + Ch(a,b,c) + 0xd192e819 + W[44];
172         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
173         t1 = c + e1(h) + Ch(h,a,b) + 0xd6990624 + W[45];
174         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
175         t1 = b + e1(g) + Ch(g,h,a) + 0xf40e3585 + W[46];
176         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
177         t1 = a + e1(f) + Ch(f,g,h) + 0x106aa070 + W[47];
178         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
179
180         t1 = h + e1(e) + Ch(e,f,g) + 0x19a4c116 + W[48];
181         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
182         t1 = g + e1(d) + Ch(d,e,f) + 0x1e376c08 + W[49];
183         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
184         t1 = f + e1(c) + Ch(c,d,e) + 0x2748774c + W[50];
185         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
186         t1 = e + e1(b) + Ch(b,c,d) + 0x34b0bcb5 + W[51];
187         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
188         t1 = d + e1(a) + Ch(a,b,c) + 0x391c0cb3 + W[52];
189         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
190         t1 = c + e1(h) + Ch(h,a,b) + 0x4ed8aa4a + W[53];
191         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
192         t1 = b + e1(g) + Ch(g,h,a) + 0x5b9cca4f + W[54];
193         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
194         t1 = a + e1(f) + Ch(f,g,h) + 0x682e6ff3 + W[55];
195         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
196
197         t1 = h + e1(e) + Ch(e,f,g) + 0x748f82ee + W[56];
198         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
199         t1 = g + e1(d) + Ch(d,e,f) + 0x78a5636f + W[57];
200         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
201         t1 = f + e1(c) + Ch(c,d,e) + 0x84c87814 + W[58];
202         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
203         t1 = e + e1(b) + Ch(b,c,d) + 0x8cc70208 + W[59];
204         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
205         t1 = d + e1(a) + Ch(a,b,c) + 0x90befffa + W[60];
206         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
207         t1 = c + e1(h) + Ch(h,a,b) + 0xa4506ceb + W[61];
208         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
209         t1 = b + e1(g) + Ch(g,h,a) + 0xbef9a3f7 + W[62];
210         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
211         t1 = a + e1(f) + Ch(f,g,h) + 0xc67178f2 + W[63];
212         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
213
214         state[0] += a; state[1] += b; state[2] += c; state[3] += d;
215         state[4] += e; state[5] += f; state[6] += g; state[7] += h;
216
217         /* clear any sensitive info... */
218         a = b = c = d = e = f = g = h = t1 = t2 = 0;
219         memset(W, 0, 64 * sizeof(u32));
220 }
221
222
223 static void sha224_init(struct crypto_tfm *tfm)
224 {
225         struct sha256_ctx *sctx = crypto_tfm_ctx(tfm);
226         sctx->state[0] = SHA224_H0;
227         sctx->state[1] = SHA224_H1;
228         sctx->state[2] = SHA224_H2;
229         sctx->state[3] = SHA224_H3;
230         sctx->state[4] = SHA224_H4;
231         sctx->state[5] = SHA224_H5;
232         sctx->state[6] = SHA224_H6;
233         sctx->state[7] = SHA224_H7;
234         sctx->count[0] = 0;
235         sctx->count[1] = 0;
236 }
237
238 static void sha256_init(struct crypto_tfm *tfm)
239 {
240         struct sha256_ctx *sctx = crypto_tfm_ctx(tfm);
241         sctx->state[0] = SHA256_H0;
242         sctx->state[1] = SHA256_H1;
243         sctx->state[2] = SHA256_H2;
244         sctx->state[3] = SHA256_H3;
245         sctx->state[4] = SHA256_H4;
246         sctx->state[5] = SHA256_H5;
247         sctx->state[6] = SHA256_H6;
248         sctx->state[7] = SHA256_H7;
249         sctx->count[0] = sctx->count[1] = 0;
250 }
251
252 static void sha256_update(struct crypto_tfm *tfm, const u8 *data,
253                           unsigned int len)
254 {
255         struct sha256_ctx *sctx = crypto_tfm_ctx(tfm);
256         unsigned int i, index, part_len;
257
258         /* Compute number of bytes mod 128 */
259         index = (unsigned int)((sctx->count[0] >> 3) & 0x3f);
260
261         /* Update number of bits */
262         if ((sctx->count[0] += (len << 3)) < (len << 3)) {
263                 sctx->count[1]++;
264                 sctx->count[1] += (len >> 29);
265         }
266
267         part_len = 64 - index;
268
269         /* Transform as many times as possible. */
270         if (len >= part_len) {
271                 memcpy(&sctx->buf[index], data, part_len);
272                 sha256_transform(sctx->state, sctx->buf);
273
274                 for (i = part_len; i + 63 < len; i += 64)
275                         sha256_transform(sctx->state, &data[i]);
276                 index = 0;
277         } else {
278                 i = 0;
279         }
280         
281         /* Buffer remaining input */
282         memcpy(&sctx->buf[index], &data[i], len-i);
283 }
284
285 static void sha256_final(struct crypto_tfm *tfm, u8 *out)
286 {
287         struct sha256_ctx *sctx = crypto_tfm_ctx(tfm);
288         __be32 *dst = (__be32 *)out;
289         __be32 bits[2];
290         unsigned int index, pad_len;
291         int i;
292         static const u8 padding[64] = { 0x80, };
293
294         /* Save number of bits */
295         bits[1] = cpu_to_be32(sctx->count[0]);
296         bits[0] = cpu_to_be32(sctx->count[1]);
297
298         /* Pad out to 56 mod 64. */
299         index = (sctx->count[0] >> 3) & 0x3f;
300         pad_len = (index < 56) ? (56 - index) : ((64+56) - index);
301         sha256_update(tfm, padding, pad_len);
302
303         /* Append length (before padding) */
304         sha256_update(tfm, (const u8 *)bits, sizeof(bits));
305
306         /* Store state in digest */
307         for (i = 0; i < 8; i++)
308                 dst[i] = cpu_to_be32(sctx->state[i]);
309
310         /* Zeroize sensitive information. */
311         memset(sctx, 0, sizeof(*sctx));
312 }
313
314 static void sha224_final(struct crypto_tfm *tfm, u8 *hash)
315 {
316         u8 D[SHA256_DIGEST_SIZE];
317
318         sha256_final(tfm, D);
319
320         memcpy(hash, D, SHA224_DIGEST_SIZE);
321         memset(D, 0, SHA256_DIGEST_SIZE);
322 }
323
324 static struct crypto_alg sha256 = {
325         .cra_name       =       "sha256",
326         .cra_driver_name=       "sha256-generic",
327         .cra_flags      =       CRYPTO_ALG_TYPE_DIGEST,
328         .cra_blocksize  =       SHA256_BLOCK_SIZE,
329         .cra_ctxsize    =       sizeof(struct sha256_ctx),
330         .cra_module     =       THIS_MODULE,
331         .cra_alignmask  =       3,
332         .cra_list       =       LIST_HEAD_INIT(sha256.cra_list),
333         .cra_u          =       { .digest = {
334         .dia_digestsize =       SHA256_DIGEST_SIZE,
335         .dia_init       =       sha256_init,
336         .dia_update     =       sha256_update,
337         .dia_final      =       sha256_final } }
338 };
339
340 static struct crypto_alg sha224 = {
341         .cra_name       = "sha224",
342         .cra_driver_name = "sha224-generic",
343         .cra_flags      = CRYPTO_ALG_TYPE_DIGEST,
344         .cra_blocksize  = SHA224_BLOCK_SIZE,
345         .cra_ctxsize    = sizeof(struct sha256_ctx),
346         .cra_module     = THIS_MODULE,
347         .cra_alignmask  = 3,
348         .cra_list       = LIST_HEAD_INIT(sha224.cra_list),
349         .cra_u          = { .digest = {
350         .dia_digestsize = SHA224_DIGEST_SIZE,
351         .dia_init       = sha224_init,
352         .dia_update     = sha256_update,
353         .dia_final      = sha224_final } }
354 };
355
356 static int __init init(void)
357 {
358         int ret = 0;
359
360         ret = crypto_register_alg(&sha224);
361
362         if (ret < 0)
363                 return ret;
364
365         ret = crypto_register_alg(&sha256);
366
367         if (ret < 0)
368                 crypto_unregister_alg(&sha224);
369
370         return ret;
371 }
372
373 static void __exit fini(void)
374 {
375         crypto_unregister_alg(&sha224);
376         crypto_unregister_alg(&sha256);
377 }
378
379 module_init(init);
380 module_exit(fini);
381
382 MODULE_LICENSE("GPL");
383 MODULE_DESCRIPTION("SHA-224 and SHA-256 Secure Hash Algorithm");
384
385 MODULE_ALIAS("sha224");
386 MODULE_ALIAS("sha256");