Merge branch 'for-linus' of git://linux-nfs.org/~bfields/linux
[linux-2.6] / arch / sparc64 / kernel / ds.c
1 /* ds.c: Domain Services driver for Logical Domains
2  *
3  * Copyright (C) 2007 David S. Miller <davem@davemloft.net>
4  */
5
6 #include <linux/kernel.h>
7 #include <linux/module.h>
8 #include <linux/types.h>
9 #include <linux/module.h>
10 #include <linux/string.h>
11 #include <linux/slab.h>
12 #include <linux/sched.h>
13 #include <linux/delay.h>
14 #include <linux/mutex.h>
15 #include <linux/kthread.h>
16 #include <linux/cpu.h>
17
18 #include <asm/ldc.h>
19 #include <asm/vio.h>
20 #include <asm/power.h>
21 #include <asm/mdesc.h>
22 #include <asm/head.h>
23 #include <asm/irq.h>
24
25 #define DRV_MODULE_NAME         "ds"
26 #define PFX DRV_MODULE_NAME     ": "
27 #define DRV_MODULE_VERSION      "1.0"
28 #define DRV_MODULE_RELDATE      "Jul 11, 2007"
29
30 static char version[] __devinitdata =
31         DRV_MODULE_NAME ".c:v" DRV_MODULE_VERSION " (" DRV_MODULE_RELDATE ")\n";
32 MODULE_AUTHOR("David S. Miller (davem@davemloft.net)");
33 MODULE_DESCRIPTION("Sun LDOM domain services driver");
34 MODULE_LICENSE("GPL");
35 MODULE_VERSION(DRV_MODULE_VERSION);
36
37 struct ds_msg_tag {
38         __u32                   type;
39 #define DS_INIT_REQ             0x00
40 #define DS_INIT_ACK             0x01
41 #define DS_INIT_NACK            0x02
42 #define DS_REG_REQ              0x03
43 #define DS_REG_ACK              0x04
44 #define DS_REG_NACK             0x05
45 #define DS_UNREG_REQ            0x06
46 #define DS_UNREG_ACK            0x07
47 #define DS_UNREG_NACK           0x08
48 #define DS_DATA                 0x09
49 #define DS_NACK                 0x0a
50
51         __u32                   len;
52 };
53
54 /* Result codes */
55 #define DS_OK                   0x00
56 #define DS_REG_VER_NACK         0x01
57 #define DS_REG_DUP              0x02
58 #define DS_INV_HDL              0x03
59 #define DS_TYPE_UNKNOWN         0x04
60
61 struct ds_version {
62         __u16                   major;
63         __u16                   minor;
64 };
65
66 struct ds_ver_req {
67         struct ds_msg_tag       tag;
68         struct ds_version       ver;
69 };
70
71 struct ds_ver_ack {
72         struct ds_msg_tag       tag;
73         __u16                   minor;
74 };
75
76 struct ds_ver_nack {
77         struct ds_msg_tag       tag;
78         __u16                   major;
79 };
80
81 struct ds_reg_req {
82         struct ds_msg_tag       tag;
83         __u64                   handle;
84         __u16                   major;
85         __u16                   minor;
86         char                    svc_id[0];
87 };
88
89 struct ds_reg_ack {
90         struct ds_msg_tag       tag;
91         __u64                   handle;
92         __u16                   minor;
93 };
94
95 struct ds_reg_nack {
96         struct ds_msg_tag       tag;
97         __u64                   handle;
98         __u16                   major;
99 };
100
101 struct ds_unreg_req {
102         struct ds_msg_tag       tag;
103         __u64                   handle;
104 };
105
106 struct ds_unreg_ack {
107         struct ds_msg_tag       tag;
108         __u64                   handle;
109 };
110
111 struct ds_unreg_nack {
112         struct ds_msg_tag       tag;
113         __u64                   handle;
114 };
115
116 struct ds_data {
117         struct ds_msg_tag       tag;
118         __u64                   handle;
119 };
120
121 struct ds_data_nack {
122         struct ds_msg_tag       tag;
123         __u64                   handle;
124         __u64                   result;
125 };
126
127 struct ds_cap_state {
128         __u64                   handle;
129
130         void                    (*data)(struct ldc_channel *lp,
131                                         struct ds_cap_state *cp,
132                                         void *buf, int len);
133
134         const char              *service_id;
135
136         u8                      state;
137 #define CAP_STATE_UNKNOWN       0x00
138 #define CAP_STATE_REG_SENT      0x01
139 #define CAP_STATE_REGISTERED    0x02
140 };
141
142 static void md_update_data(struct ldc_channel *lp, struct ds_cap_state *cp,
143                            void *buf, int len);
144 static void domain_shutdown_data(struct ldc_channel *lp,
145                                  struct ds_cap_state *cp,
146                                  void *buf, int len);
147 static void domain_panic_data(struct ldc_channel *lp,
148                               struct ds_cap_state *cp,
149                               void *buf, int len);
150 #ifdef CONFIG_HOTPLUG_CPU
151 static void dr_cpu_data(struct ldc_channel *lp,
152                         struct ds_cap_state *cp,
153                         void *buf, int len);
154 #endif
155 static void ds_pri_data(struct ldc_channel *lp,
156                         struct ds_cap_state *cp,
157                         void *buf, int len);
158 static void ds_var_data(struct ldc_channel *lp,
159                         struct ds_cap_state *cp,
160                         void *buf, int len);
161
162 struct ds_cap_state ds_states[] = {
163         {
164                 .service_id     = "md-update",
165                 .data           = md_update_data,
166         },
167         {
168                 .service_id     = "domain-shutdown",
169                 .data           = domain_shutdown_data,
170         },
171         {
172                 .service_id     = "domain-panic",
173                 .data           = domain_panic_data,
174         },
175 #ifdef CONFIG_HOTPLUG_CPU
176         {
177                 .service_id     = "dr-cpu",
178                 .data           = dr_cpu_data,
179         },
180 #endif
181         {
182                 .service_id     = "pri",
183                 .data           = ds_pri_data,
184         },
185         {
186                 .service_id     = "var-config",
187                 .data           = ds_var_data,
188         },
189         {
190                 .service_id     = "var-config-backup",
191                 .data           = ds_var_data,
192         },
193 };
194
195 static DEFINE_SPINLOCK(ds_lock);
196
197 struct ds_info {
198         struct ldc_channel      *lp;
199         u8                      hs_state;
200 #define DS_HS_START             0x01
201 #define DS_HS_DONE              0x02
202
203         void                    *rcv_buf;
204         int                     rcv_buf_len;
205 };
206
207 static struct ds_info *ds_info;
208
209 static struct ds_cap_state *find_cap(u64 handle)
210 {
211         unsigned int index = handle >> 32;
212
213         if (index >= ARRAY_SIZE(ds_states))
214                 return NULL;
215         return &ds_states[index];
216 }
217
218 static struct ds_cap_state *find_cap_by_string(const char *name)
219 {
220         int i;
221
222         for (i = 0; i < ARRAY_SIZE(ds_states); i++) {
223                 if (strcmp(ds_states[i].service_id, name))
224                         continue;
225
226                 return &ds_states[i];
227         }
228         return NULL;
229 }
230
231 static int __ds_send(struct ldc_channel *lp, void *data, int len)
232 {
233         int err, limit = 1000;
234
235         err = -EINVAL;
236         while (limit-- > 0) {
237                 err = ldc_write(lp, data, len);
238                 if (!err || (err != -EAGAIN))
239                         break;
240                 udelay(1);
241         }
242
243         return err;
244 }
245
246 static int ds_send(struct ldc_channel *lp, void *data, int len)
247 {
248         unsigned long flags;
249         int err;
250
251         spin_lock_irqsave(&ds_lock, flags);
252         err = __ds_send(lp, data, len);
253         spin_unlock_irqrestore(&ds_lock, flags);
254
255         return err;
256 }
257
258 struct ds_md_update_req {
259         __u64                           req_num;
260 };
261
262 struct ds_md_update_res {
263         __u64                           req_num;
264         __u32                           result;
265 };
266
267 static void md_update_data(struct ldc_channel *lp,
268                            struct ds_cap_state *dp,
269                            void *buf, int len)
270 {
271         struct ds_data *dpkt = buf;
272         struct ds_md_update_req *rp;
273         struct {
274                 struct ds_data          data;
275                 struct ds_md_update_res res;
276         } pkt;
277
278         rp = (struct ds_md_update_req *) (dpkt + 1);
279
280         printk(KERN_INFO PFX "Machine description update.\n");
281
282         mdesc_update();
283
284         memset(&pkt, 0, sizeof(pkt));
285         pkt.data.tag.type = DS_DATA;
286         pkt.data.tag.len = sizeof(pkt) - sizeof(struct ds_msg_tag);
287         pkt.data.handle = dp->handle;
288         pkt.res.req_num = rp->req_num;
289         pkt.res.result = DS_OK;
290
291         ds_send(lp, &pkt, sizeof(pkt));
292 }
293
294 struct ds_shutdown_req {
295         __u64                           req_num;
296         __u32                           ms_delay;
297 };
298
299 struct ds_shutdown_res {
300         __u64                           req_num;
301         __u32                           result;
302         char                            reason[1];
303 };
304
305 static void domain_shutdown_data(struct ldc_channel *lp,
306                                  struct ds_cap_state *dp,
307                                  void *buf, int len)
308 {
309         struct ds_data *dpkt = buf;
310         struct ds_shutdown_req *rp;
311         struct {
312                 struct ds_data          data;
313                 struct ds_shutdown_res  res;
314         } pkt;
315
316         rp = (struct ds_shutdown_req *) (dpkt + 1);
317
318         printk(KERN_ALERT PFX "Shutdown request from "
319                "LDOM manager received.\n");
320
321         memset(&pkt, 0, sizeof(pkt));
322         pkt.data.tag.type = DS_DATA;
323         pkt.data.tag.len = sizeof(pkt) - sizeof(struct ds_msg_tag);
324         pkt.data.handle = dp->handle;
325         pkt.res.req_num = rp->req_num;
326         pkt.res.result = DS_OK;
327         pkt.res.reason[0] = 0;
328
329         ds_send(lp, &pkt, sizeof(pkt));
330
331         wake_up_powerd();
332 }
333
334 struct ds_panic_req {
335         __u64                           req_num;
336 };
337
338 struct ds_panic_res {
339         __u64                           req_num;
340         __u32                           result;
341         char                            reason[1];
342 };
343
344 static void domain_panic_data(struct ldc_channel *lp,
345                               struct ds_cap_state *dp,
346                               void *buf, int len)
347 {
348         struct ds_data *dpkt = buf;
349         struct ds_panic_req *rp;
350         struct {
351                 struct ds_data          data;
352                 struct ds_panic_res     res;
353         } pkt;
354
355         rp = (struct ds_panic_req *) (dpkt + 1);
356
357         printk(KERN_ALERT PFX "Panic request from "
358                "LDOM manager received.\n");
359
360         memset(&pkt, 0, sizeof(pkt));
361         pkt.data.tag.type = DS_DATA;
362         pkt.data.tag.len = sizeof(pkt) - sizeof(struct ds_msg_tag);
363         pkt.data.handle = dp->handle;
364         pkt.res.req_num = rp->req_num;
365         pkt.res.result = DS_OK;
366         pkt.res.reason[0] = 0;
367
368         ds_send(lp, &pkt, sizeof(pkt));
369
370         panic("PANIC requested by LDOM manager.");
371 }
372
373 #ifdef CONFIG_HOTPLUG_CPU
374 struct dr_cpu_tag {
375         __u64                           req_num;
376         __u32                           type;
377 #define DR_CPU_CONFIGURE                0x43
378 #define DR_CPU_UNCONFIGURE              0x55
379 #define DR_CPU_FORCE_UNCONFIGURE        0x46
380 #define DR_CPU_STATUS                   0x53
381
382 /* Responses */
383 #define DR_CPU_OK                       0x6f
384 #define DR_CPU_ERROR                    0x65
385
386         __u32                           num_records;
387 };
388
389 struct dr_cpu_resp_entry {
390         __u32                           cpu;
391         __u32                           result;
392 #define DR_CPU_RES_OK                   0x00
393 #define DR_CPU_RES_FAILURE              0x01
394 #define DR_CPU_RES_BLOCKED              0x02
395 #define DR_CPU_RES_CPU_NOT_RESPONDING   0x03
396 #define DR_CPU_RES_NOT_IN_MD            0x04
397
398         __u32                           stat;
399 #define DR_CPU_STAT_NOT_PRESENT         0x00
400 #define DR_CPU_STAT_UNCONFIGURED        0x01
401 #define DR_CPU_STAT_CONFIGURED          0x02
402
403         __u32                           str_off;
404 };
405
406 static void __dr_cpu_send_error(struct ds_cap_state *cp, struct ds_data *data)
407 {
408         struct dr_cpu_tag *tag = (struct dr_cpu_tag *) (data + 1);
409         struct ds_info *dp = ds_info;
410         struct {
411                 struct ds_data          data;
412                 struct dr_cpu_tag       tag;
413         } pkt;
414         int msg_len;
415
416         memset(&pkt, 0, sizeof(pkt));
417         pkt.data.tag.type = DS_DATA;
418         pkt.data.handle = cp->handle;
419         pkt.tag.req_num = tag->req_num;
420         pkt.tag.type = DR_CPU_ERROR;
421         pkt.tag.num_records = 0;
422
423         msg_len = (sizeof(struct ds_data) +
424                    sizeof(struct dr_cpu_tag));
425
426         pkt.data.tag.len = msg_len - sizeof(struct ds_msg_tag);
427
428         __ds_send(dp->lp, &pkt, msg_len);
429 }
430
431 static void dr_cpu_send_error(struct ds_cap_state *cp, struct ds_data *data)
432 {
433         unsigned long flags;
434
435         spin_lock_irqsave(&ds_lock, flags);
436         __dr_cpu_send_error(cp, data);
437         spin_unlock_irqrestore(&ds_lock, flags);
438 }
439
440 #define CPU_SENTINEL    0xffffffff
441
442 static void purge_dups(u32 *list, u32 num_ents)
443 {
444         unsigned int i;
445
446         for (i = 0; i < num_ents; i++) {
447                 u32 cpu = list[i];
448                 unsigned int j;
449
450                 if (cpu == CPU_SENTINEL)
451                         continue;
452
453                 for (j = i + 1; j < num_ents; j++) {
454                         if (list[j] == cpu)
455                                 list[j] = CPU_SENTINEL;
456                 }
457         }
458 }
459
460 static int dr_cpu_size_response(int ncpus)
461 {
462         return (sizeof(struct ds_data) +
463                 sizeof(struct dr_cpu_tag) +
464                 (sizeof(struct dr_cpu_resp_entry) * ncpus));
465 }
466
467 static void dr_cpu_init_response(struct ds_data *resp, u64 req_num,
468                                  u64 handle, int resp_len, int ncpus,
469                                  cpumask_t *mask, u32 default_stat)
470 {
471         struct dr_cpu_resp_entry *ent;
472         struct dr_cpu_tag *tag;
473         int i, cpu;
474
475         tag = (struct dr_cpu_tag *) (resp + 1);
476         ent = (struct dr_cpu_resp_entry *) (tag + 1);
477
478         resp->tag.type = DS_DATA;
479         resp->tag.len = resp_len - sizeof(struct ds_msg_tag);
480         resp->handle = handle;
481         tag->req_num = req_num;
482         tag->type = DR_CPU_OK;
483         tag->num_records = ncpus;
484
485         i = 0;
486         for_each_cpu_mask(cpu, *mask) {
487                 ent[i].cpu = cpu;
488                 ent[i].result = DR_CPU_RES_OK;
489                 ent[i].stat = default_stat;
490                 i++;
491         }
492         BUG_ON(i != ncpus);
493 }
494
495 static void dr_cpu_mark(struct ds_data *resp, int cpu, int ncpus,
496                         u32 res, u32 stat)
497 {
498         struct dr_cpu_resp_entry *ent;
499         struct dr_cpu_tag *tag;
500         int i;
501
502         tag = (struct dr_cpu_tag *) (resp + 1);
503         ent = (struct dr_cpu_resp_entry *) (tag + 1);
504
505         for (i = 0; i < ncpus; i++) {
506                 if (ent[i].cpu != cpu)
507                         continue;
508                 ent[i].result = res;
509                 ent[i].stat = stat;
510                 break;
511         }
512 }
513
514 static int dr_cpu_configure(struct ds_cap_state *cp, u64 req_num,
515                             cpumask_t *mask)
516 {
517         struct ds_data *resp;
518         int resp_len, ncpus, cpu;
519         unsigned long flags;
520
521         ncpus = cpus_weight(*mask);
522         resp_len = dr_cpu_size_response(ncpus);
523         resp = kzalloc(resp_len, GFP_KERNEL);
524         if (!resp)
525                 return -ENOMEM;
526
527         dr_cpu_init_response(resp, req_num, cp->handle,
528                              resp_len, ncpus, mask,
529                              DR_CPU_STAT_CONFIGURED);
530
531         mdesc_fill_in_cpu_data(*mask);
532
533         for_each_cpu_mask(cpu, *mask) {
534                 int err;
535
536                 printk(KERN_INFO PFX "Starting cpu %d...\n", cpu);
537                 err = cpu_up(cpu);
538                 if (err) {
539                         __u32 res = DR_CPU_RES_FAILURE;
540                         __u32 stat = DR_CPU_STAT_UNCONFIGURED;
541
542                         if (!cpu_present(cpu)) {
543                                 /* CPU not present in MD */
544                                 res = DR_CPU_RES_NOT_IN_MD;
545                                 stat = DR_CPU_STAT_NOT_PRESENT;
546                         } else if (err == -ENODEV) {
547                                 /* CPU did not call in successfully */
548                                 res = DR_CPU_RES_CPU_NOT_RESPONDING;
549                         }
550
551                         printk(KERN_INFO PFX "CPU startup failed err=%d\n",
552                                err);
553                         dr_cpu_mark(resp, cpu, ncpus, res, stat);
554                 }
555         }
556
557         spin_lock_irqsave(&ds_lock, flags);
558         __ds_send(ds_info->lp, resp, resp_len);
559         spin_unlock_irqrestore(&ds_lock, flags);
560
561         kfree(resp);
562
563         /* Redistribute IRQs, taking into account the new cpus.  */
564         fixup_irqs();
565
566         return 0;
567 }
568
569 static int dr_cpu_unconfigure(struct ds_cap_state *cp, u64 req_num,
570                               cpumask_t *mask)
571 {
572         struct ds_data *resp;
573         int resp_len, ncpus, cpu;
574         unsigned long flags;
575
576         ncpus = cpus_weight(*mask);
577         resp_len = dr_cpu_size_response(ncpus);
578         resp = kzalloc(resp_len, GFP_KERNEL);
579         if (!resp)
580                 return -ENOMEM;
581
582         dr_cpu_init_response(resp, req_num, cp->handle,
583                              resp_len, ncpus, mask,
584                              DR_CPU_STAT_UNCONFIGURED);
585
586         for_each_cpu_mask(cpu, *mask) {
587                 int err;
588
589                 printk(KERN_INFO PFX "CPU[%d]: Shutting down cpu %d...\n",
590                        smp_processor_id(), cpu);
591                 err = cpu_down(cpu);
592                 if (err)
593                         dr_cpu_mark(resp, cpu, ncpus,
594                                     DR_CPU_RES_FAILURE,
595                                     DR_CPU_STAT_CONFIGURED);
596         }
597
598         spin_lock_irqsave(&ds_lock, flags);
599         __ds_send(ds_info->lp, resp, resp_len);
600         spin_unlock_irqrestore(&ds_lock, flags);
601
602         kfree(resp);
603
604         return 0;
605 }
606
607 static void dr_cpu_data(struct ldc_channel *lp,
608                         struct ds_cap_state *cp,
609                         void *buf, int len)
610 {
611         struct ds_data *data = buf;
612         struct dr_cpu_tag *tag = (struct dr_cpu_tag *) (data + 1);
613         u32 *cpu_list = (u32 *) (tag + 1);
614         u64 req_num = tag->req_num;
615         cpumask_t mask;
616         unsigned int i;
617         int err;
618
619         switch (tag->type) {
620         case DR_CPU_CONFIGURE:
621         case DR_CPU_UNCONFIGURE:
622         case DR_CPU_FORCE_UNCONFIGURE:
623                 break;
624
625         default:
626                 dr_cpu_send_error(cp, data);
627                 return;
628         }
629
630         purge_dups(cpu_list, tag->num_records);
631
632         cpus_clear(mask);
633         for (i = 0; i < tag->num_records; i++) {
634                 if (cpu_list[i] == CPU_SENTINEL)
635                         continue;
636
637                 if (cpu_list[i] < NR_CPUS)
638                         cpu_set(cpu_list[i], mask);
639         }
640
641         if (tag->type == DR_CPU_CONFIGURE)
642                 err = dr_cpu_configure(cp, req_num, &mask);
643         else
644                 err = dr_cpu_unconfigure(cp, req_num, &mask);
645
646         if (err)
647                 dr_cpu_send_error(cp, data);
648 }
649 #endif /* CONFIG_HOTPLUG_CPU */
650
651 struct ds_pri_msg {
652         __u64                           req_num;
653         __u64                           type;
654 #define DS_PRI_REQUEST                  0x00
655 #define DS_PRI_DATA                     0x01
656 #define DS_PRI_UPDATE                   0x02
657 };
658
659 static void ds_pri_data(struct ldc_channel *lp,
660                         struct ds_cap_state *dp,
661                         void *buf, int len)
662 {
663         struct ds_data *dpkt = buf;
664         struct ds_pri_msg *rp;
665
666         rp = (struct ds_pri_msg *) (dpkt + 1);
667
668         printk(KERN_INFO PFX "PRI REQ [%lx:%lx], len=%d\n",
669                rp->req_num, rp->type, len);
670 }
671
672 struct ds_var_hdr {
673         __u32                           type;
674 #define DS_VAR_SET_REQ                  0x00
675 #define DS_VAR_DELETE_REQ               0x01
676 #define DS_VAR_SET_RESP                 0x02
677 #define DS_VAR_DELETE_RESP              0x03
678 };
679
680 struct ds_var_set_msg {
681         struct ds_var_hdr               hdr;
682         char                            name_and_value[0];
683 };
684
685 struct ds_var_delete_msg {
686         struct ds_var_hdr               hdr;
687         char                            name[0];
688 };
689
690 struct ds_var_resp {
691         struct ds_var_hdr               hdr;
692         __u32                           result;
693 #define DS_VAR_SUCCESS                  0x00
694 #define DS_VAR_NO_SPACE                 0x01
695 #define DS_VAR_INVALID_VAR              0x02
696 #define DS_VAR_INVALID_VAL              0x03
697 #define DS_VAR_NOT_PRESENT              0x04
698 };
699
700 static DEFINE_MUTEX(ds_var_mutex);
701 static int ds_var_doorbell;
702 static int ds_var_response;
703
704 static void ds_var_data(struct ldc_channel *lp,
705                         struct ds_cap_state *dp,
706                         void *buf, int len)
707 {
708         struct ds_data *dpkt = buf;
709         struct ds_var_resp *rp;
710
711         rp = (struct ds_var_resp *) (dpkt + 1);
712
713         if (rp->hdr.type != DS_VAR_SET_RESP &&
714             rp->hdr.type != DS_VAR_DELETE_RESP)
715                 return;
716
717         ds_var_response = rp->result;
718         wmb();
719         ds_var_doorbell = 1;
720 }
721
722 void ldom_set_var(const char *var, const char *value)
723 {
724         struct ds_info *dp = ds_info;
725         struct ds_cap_state *cp;
726
727         cp = find_cap_by_string("var-config");
728         if (cp->state != CAP_STATE_REGISTERED)
729                 cp = find_cap_by_string("var-config-backup");
730
731         if (cp->state == CAP_STATE_REGISTERED) {
732                 union {
733                         struct {
734                                 struct ds_data          data;
735                                 struct ds_var_set_msg   msg;
736                         } header;
737                         char                    all[512];
738                 } pkt;
739                 unsigned long flags;
740                 char  *base, *p;
741                 int msg_len, loops;
742
743                 memset(&pkt, 0, sizeof(pkt));
744                 pkt.header.data.tag.type = DS_DATA;
745                 pkt.header.data.handle = cp->handle;
746                 pkt.header.msg.hdr.type = DS_VAR_SET_REQ;
747                 base = p = &pkt.header.msg.name_and_value[0];
748                 strcpy(p, var);
749                 p += strlen(var) + 1;
750                 strcpy(p, value);
751                 p += strlen(value) + 1;
752
753                 msg_len = (sizeof(struct ds_data) +
754                            sizeof(struct ds_var_set_msg) +
755                            (p - base));
756                 msg_len = (msg_len + 3) & ~3;
757                 pkt.header.data.tag.len = msg_len - sizeof(struct ds_msg_tag);
758
759                 mutex_lock(&ds_var_mutex);
760
761                 spin_lock_irqsave(&ds_lock, flags);
762                 ds_var_doorbell = 0;
763                 ds_var_response = -1;
764
765                 __ds_send(dp->lp, &pkt, msg_len);
766                 spin_unlock_irqrestore(&ds_lock, flags);
767
768                 loops = 1000;
769                 while (ds_var_doorbell == 0) {
770                         if (loops-- < 0)
771                                 break;
772                         barrier();
773                         udelay(100);
774                 }
775
776                 mutex_unlock(&ds_var_mutex);
777
778                 if (ds_var_doorbell == 0 ||
779                     ds_var_response != DS_VAR_SUCCESS)
780                         printk(KERN_ERR PFX "var-config [%s:%s] "
781                                "failed, response(%d).\n",
782                                var, value,
783                                ds_var_response);
784         } else {
785                 printk(KERN_ERR PFX "var-config not registered so "
786                        "could not set (%s) variable to (%s).\n",
787                        var, value);
788         }
789 }
790
791 void ldom_reboot(const char *boot_command)
792 {
793         /* Don't bother with any of this if the boot_command
794          * is empty.
795          */
796         if (boot_command && strlen(boot_command)) {
797                 char full_boot_str[256];
798
799                 strcpy(full_boot_str, "boot ");
800                 strcpy(full_boot_str + strlen("boot "), boot_command);
801
802                 ldom_set_var("reboot-command", full_boot_str);
803         }
804         sun4v_mach_sir();
805 }
806
807 void ldom_power_off(void)
808 {
809         sun4v_mach_exit(0);
810 }
811
812 static void ds_conn_reset(struct ds_info *dp)
813 {
814         printk(KERN_ERR PFX "ds_conn_reset() from %p\n",
815                __builtin_return_address(0));
816 }
817
818 static int register_services(struct ds_info *dp)
819 {
820         struct ldc_channel *lp = dp->lp;
821         int i;
822
823         for (i = 0; i < ARRAY_SIZE(ds_states); i++) {
824                 struct {
825                         struct ds_reg_req req;
826                         u8 id_buf[256];
827                 } pbuf;
828                 struct ds_cap_state *cp = &ds_states[i];
829                 int err, msg_len;
830                 u64 new_count;
831
832                 if (cp->state == CAP_STATE_REGISTERED)
833                         continue;
834
835                 new_count = sched_clock() & 0xffffffff;
836                 cp->handle = ((u64) i << 32) | new_count;
837
838                 msg_len = (sizeof(struct ds_reg_req) +
839                            strlen(cp->service_id));
840
841                 memset(&pbuf, 0, sizeof(pbuf));
842                 pbuf.req.tag.type = DS_REG_REQ;
843                 pbuf.req.tag.len = (msg_len - sizeof(struct ds_msg_tag));
844                 pbuf.req.handle = cp->handle;
845                 pbuf.req.major = 1;
846                 pbuf.req.minor = 0;
847                 strcpy(pbuf.req.svc_id, cp->service_id);
848
849                 err = __ds_send(lp, &pbuf, msg_len);
850                 if (err > 0)
851                         cp->state = CAP_STATE_REG_SENT;
852         }
853         return 0;
854 }
855
856 static int ds_handshake(struct ds_info *dp, struct ds_msg_tag *pkt)
857 {
858
859         if (dp->hs_state == DS_HS_START) {
860                 if (pkt->type != DS_INIT_ACK)
861                         goto conn_reset;
862
863                 dp->hs_state = DS_HS_DONE;
864
865                 return register_services(dp);
866         }
867
868         if (dp->hs_state != DS_HS_DONE)
869                 goto conn_reset;
870
871         if (pkt->type == DS_REG_ACK) {
872                 struct ds_reg_ack *ap = (struct ds_reg_ack *) pkt;
873                 struct ds_cap_state *cp = find_cap(ap->handle);
874
875                 if (!cp) {
876                         printk(KERN_ERR PFX "REG ACK for unknown handle %lx\n",
877                                ap->handle);
878                         return 0;
879                 }
880                 printk(KERN_INFO PFX "Registered %s service.\n",
881                        cp->service_id);
882                 cp->state = CAP_STATE_REGISTERED;
883         } else if (pkt->type == DS_REG_NACK) {
884                 struct ds_reg_nack *np = (struct ds_reg_nack *) pkt;
885                 struct ds_cap_state *cp = find_cap(np->handle);
886
887                 if (!cp) {
888                         printk(KERN_ERR PFX "REG NACK for "
889                                "unknown handle %lx\n",
890                                np->handle);
891                         return 0;
892                 }
893                 printk(KERN_INFO PFX "Could not register %s service\n",
894                        cp->service_id);
895                 cp->state = CAP_STATE_UNKNOWN;
896         }
897
898         return 0;
899
900 conn_reset:
901         ds_conn_reset(dp);
902         return -ECONNRESET;
903 }
904
905 static void __send_ds_nack(struct ds_info *dp, u64 handle)
906 {
907         struct ds_data_nack nack = {
908                 .tag = {
909                         .type = DS_NACK,
910                         .len = (sizeof(struct ds_data_nack) -
911                                 sizeof(struct ds_msg_tag)),
912                 },
913                 .handle = handle,
914                 .result = DS_INV_HDL,
915         };
916
917         __ds_send(dp->lp, &nack, sizeof(nack));
918 }
919
920 static LIST_HEAD(ds_work_list);
921 static DECLARE_WAIT_QUEUE_HEAD(ds_wait);
922
923 struct ds_queue_entry {
924         struct list_head                list;
925         int                             req_len;
926         int                             __pad;
927         u64                             req[0];
928 };
929
930 static void process_ds_work(void)
931 {
932         struct ds_queue_entry *qp, *tmp;
933         static struct ds_info *dp;
934         unsigned long flags;
935         LIST_HEAD(todo);
936
937         spin_lock_irqsave(&ds_lock, flags);
938         list_splice(&ds_work_list, &todo);
939         INIT_LIST_HEAD(&ds_work_list);
940         spin_unlock_irqrestore(&ds_lock, flags);
941
942         dp = ds_info;
943
944         list_for_each_entry_safe(qp, tmp, &todo, list) {
945                 struct ds_data *dpkt = (struct ds_data *) qp->req;
946                 struct ds_cap_state *cp = find_cap(dpkt->handle);
947                 int req_len = qp->req_len;
948
949                 if (!cp) {
950                         printk(KERN_ERR PFX "Data for unknown handle %lu\n",
951                                dpkt->handle);
952
953                         spin_lock_irqsave(&ds_lock, flags);
954                         __send_ds_nack(dp, dpkt->handle);
955                         spin_unlock_irqrestore(&ds_lock, flags);
956                 } else {
957                         cp->data(dp->lp, cp, dpkt, req_len);
958                 }
959
960                 list_del(&qp->list);
961                 kfree(qp);
962         }
963 }
964
965 static int ds_thread(void *__unused)
966 {
967         DEFINE_WAIT(wait);
968
969         while (1) {
970                 prepare_to_wait(&ds_wait, &wait, TASK_INTERRUPTIBLE);
971                 if (list_empty(&ds_work_list))
972                         schedule();
973                 finish_wait(&ds_wait, &wait);
974
975                 if (kthread_should_stop())
976                         break;
977
978                 process_ds_work();
979         }
980
981         return 0;
982 }
983
984 static int ds_data(struct ds_info *dp, struct ds_msg_tag *pkt, int len)
985 {
986         struct ds_data *dpkt = (struct ds_data *) pkt;
987         struct ds_queue_entry *qp;
988
989         qp = kmalloc(sizeof(struct ds_queue_entry) + len, GFP_ATOMIC);
990         if (!qp) {
991                 __send_ds_nack(dp, dpkt->handle);
992         } else {
993                 memcpy(&qp->req, pkt, len);
994                 list_add_tail(&qp->list, &ds_work_list);
995                 wake_up(&ds_wait);
996         }
997         return 0;
998 }
999
1000 static void ds_up(struct ds_info *dp)
1001 {
1002         struct ldc_channel *lp = dp->lp;
1003         struct ds_ver_req req;
1004         int err;
1005
1006         req.tag.type = DS_INIT_REQ;
1007         req.tag.len = sizeof(req) - sizeof(struct ds_msg_tag);
1008         req.ver.major = 1;
1009         req.ver.minor = 0;
1010
1011         err = __ds_send(lp, &req, sizeof(req));
1012         if (err > 0)
1013                 dp->hs_state = DS_HS_START;
1014 }
1015
1016 static void ds_reset(struct ds_info *dp)
1017 {
1018         int i;
1019
1020         dp->hs_state = 0;
1021
1022         for (i = 0; i < ARRAY_SIZE(ds_states); i++) {
1023                 struct ds_cap_state *cp = &ds_states[i];
1024
1025                 cp->state = CAP_STATE_UNKNOWN;
1026         }
1027 }
1028
1029 static void ds_event(void *arg, int event)
1030 {
1031         struct ds_info *dp = arg;
1032         struct ldc_channel *lp = dp->lp;
1033         unsigned long flags;
1034         int err;
1035
1036         spin_lock_irqsave(&ds_lock, flags);
1037
1038         if (event == LDC_EVENT_UP) {
1039                 ds_up(dp);
1040                 spin_unlock_irqrestore(&ds_lock, flags);
1041                 return;
1042         }
1043
1044         if (event == LDC_EVENT_RESET) {
1045                 ds_reset(dp);
1046                 spin_unlock_irqrestore(&ds_lock, flags);
1047                 return;
1048         }
1049
1050         if (event != LDC_EVENT_DATA_READY) {
1051                 printk(KERN_WARNING PFX "Unexpected LDC event %d\n", event);
1052                 spin_unlock_irqrestore(&ds_lock, flags);
1053                 return;
1054         }
1055
1056         err = 0;
1057         while (1) {
1058                 struct ds_msg_tag *tag;
1059
1060                 err = ldc_read(lp, dp->rcv_buf, sizeof(*tag));
1061
1062                 if (unlikely(err < 0)) {
1063                         if (err == -ECONNRESET)
1064                                 ds_conn_reset(dp);
1065                         break;
1066                 }
1067                 if (err == 0)
1068                         break;
1069
1070                 tag = dp->rcv_buf;
1071                 err = ldc_read(lp, tag + 1, tag->len);
1072
1073                 if (unlikely(err < 0)) {
1074                         if (err == -ECONNRESET)
1075                                 ds_conn_reset(dp);
1076                         break;
1077                 }
1078                 if (err < tag->len)
1079                         break;
1080
1081                 if (tag->type < DS_DATA)
1082                         err = ds_handshake(dp, dp->rcv_buf);
1083                 else
1084                         err = ds_data(dp, dp->rcv_buf,
1085                                       sizeof(*tag) + err);
1086                 if (err == -ECONNRESET)
1087                         break;
1088         }
1089
1090         spin_unlock_irqrestore(&ds_lock, flags);
1091 }
1092
1093 static int __devinit ds_probe(struct vio_dev *vdev,
1094                               const struct vio_device_id *id)
1095 {
1096         static int ds_version_printed;
1097         struct ldc_channel_config ds_cfg = {
1098                 .event          = ds_event,
1099                 .mtu            = 4096,
1100                 .mode           = LDC_MODE_STREAM,
1101         };
1102         struct ldc_channel *lp;
1103         struct ds_info *dp;
1104         int err;
1105
1106         if (ds_version_printed++ == 0)
1107                 printk(KERN_INFO "%s", version);
1108
1109         dp = kzalloc(sizeof(*dp), GFP_KERNEL);
1110         err = -ENOMEM;
1111         if (!dp)
1112                 goto out_err;
1113
1114         dp->rcv_buf = kzalloc(4096, GFP_KERNEL);
1115         if (!dp->rcv_buf)
1116                 goto out_free_dp;
1117
1118         dp->rcv_buf_len = 4096;
1119
1120         ds_cfg.tx_irq = vdev->tx_irq;
1121         ds_cfg.rx_irq = vdev->rx_irq;
1122
1123         lp = ldc_alloc(vdev->channel_id, &ds_cfg, dp);
1124         if (IS_ERR(lp)) {
1125                 err = PTR_ERR(lp);
1126                 goto out_free_rcv_buf;
1127         }
1128         dp->lp = lp;
1129
1130         err = ldc_bind(lp, "DS");
1131         if (err)
1132                 goto out_free_ldc;
1133
1134         ds_info = dp;
1135
1136         start_powerd();
1137
1138         return err;
1139
1140 out_free_ldc:
1141         ldc_free(dp->lp);
1142
1143 out_free_rcv_buf:
1144         kfree(dp->rcv_buf);
1145
1146 out_free_dp:
1147         kfree(dp);
1148
1149 out_err:
1150         return err;
1151 }
1152
1153 static int ds_remove(struct vio_dev *vdev)
1154 {
1155         return 0;
1156 }
1157
1158 static struct vio_device_id ds_match[] = {
1159         {
1160                 .type = "domain-services-port",
1161         },
1162         {},
1163 };
1164
1165 static struct vio_driver ds_driver = {
1166         .id_table       = ds_match,
1167         .probe          = ds_probe,
1168         .remove         = ds_remove,
1169         .driver         = {
1170                 .name   = "ds",
1171                 .owner  = THIS_MODULE,
1172         }
1173 };
1174
1175 static int __init ds_init(void)
1176 {
1177         int i;
1178
1179         for (i = 0; i < ARRAY_SIZE(ds_states); i++)
1180                 ds_states[i].handle = ((u64)i << 32);
1181
1182         kthread_run(ds_thread, NULL, "kldomd");
1183
1184         return vio_register_driver(&ds_driver);
1185 }
1186
1187 subsys_initcall(ds_init);