[MIPS] MT: Improved multithreading support.
[linux-2.6] / arch / mips / kernel / process.c
1 /*
2  * This file is subject to the terms and conditions of the GNU General Public
3  * License.  See the file "COPYING" in the main directory of this archive
4  * for more details.
5  *
6  * Copyright (C) 1994 - 1999, 2000 by Ralf Baechle and others.
7  * Copyright (C) 2005, 2006 by Ralf Baechle (ralf@linux-mips.org)
8  * Copyright (C) 1999, 2000 Silicon Graphics, Inc.
9  * Copyright (C) 2004 Thiemo Seufer
10  */
11 #include <linux/config.h>
12 #include <linux/errno.h>
13 #include <linux/module.h>
14 #include <linux/sched.h>
15 #include <linux/kernel.h>
16 #include <linux/mm.h>
17 #include <linux/stddef.h>
18 #include <linux/unistd.h>
19 #include <linux/ptrace.h>
20 #include <linux/slab.h>
21 #include <linux/mman.h>
22 #include <linux/personality.h>
23 #include <linux/sys.h>
24 #include <linux/user.h>
25 #include <linux/a.out.h>
26 #include <linux/init.h>
27 #include <linux/completion.h>
28 #include <linux/kallsyms.h>
29
30 #include <asm/abi.h>
31 #include <asm/bootinfo.h>
32 #include <asm/cpu.h>
33 #include <asm/dsp.h>
34 #include <asm/fpu.h>
35 #include <asm/pgtable.h>
36 #include <asm/system.h>
37 #include <asm/mipsregs.h>
38 #include <asm/processor.h>
39 #include <asm/uaccess.h>
40 #include <asm/io.h>
41 #include <asm/elf.h>
42 #include <asm/isadep.h>
43 #include <asm/inst.h>
44 #ifdef CONFIG_MIPS_MT_SMTC
45 #include <asm/mipsmtregs.h>
46 extern void smtc_idle_loop_hook(void);
47 #endif /* CONFIG_MIPS_MT_SMTC */
48
49 /*
50  * The idle thread. There's no useful work to be done, so just try to conserve
51  * power and have a low exit latency (ie sit in a loop waiting for somebody to
52  * say that they'd like to reschedule)
53  */
54 ATTRIB_NORET void cpu_idle(void)
55 {
56         /* endless idle loop with no priority at all */
57         while (1) {
58                 while (!need_resched()) {
59 #ifdef CONFIG_MIPS_MT_SMTC
60                         smtc_idle_loop_hook();
61 #endif /* CONFIG_MIPS_MT_SMTC */
62                         if (cpu_wait)
63                                 (*cpu_wait)();
64                 }
65                 preempt_enable_no_resched();
66                 schedule();
67                 preempt_disable();
68         }
69 }
70
71 /*
72  * Native o32 and N64 ABI without DSP ASE
73  */
74 struct mips_abi mips_abi = {
75         .do_signal      = do_signal,
76 #ifdef CONFIG_TRAD_SIGNALS
77         .setup_frame    = setup_frame,
78 #endif
79         .setup_rt_frame = setup_rt_frame
80 };
81
82 #ifdef CONFIG_MIPS32_O32
83 /*
84  * o32 compatibility on 64-bit kernels, without DSP ASE
85  */
86 struct mips_abi mips_abi_32 = {
87         .do_signal      = do_signal32,
88         .setup_frame    = setup_frame_32,
89         .setup_rt_frame = setup_rt_frame_32
90 };
91 #endif /* CONFIG_MIPS32_O32 */
92
93 #ifdef CONFIG_MIPS32_N32
94 /*
95  * N32 on 64-bit kernels, without DSP ASE
96  */
97 struct mips_abi mips_abi_n32 = {
98         .do_signal      = do_signal,
99         .setup_rt_frame = setup_rt_frame_n32
100 };
101 #endif /* CONFIG_MIPS32_N32 */
102
103 asmlinkage void ret_from_fork(void);
104
105 void start_thread(struct pt_regs * regs, unsigned long pc, unsigned long sp)
106 {
107         unsigned long status;
108
109         /* New thread loses kernel privileges. */
110         status = regs->cp0_status & ~(ST0_CU0|ST0_CU1|KU_MASK);
111 #ifdef CONFIG_64BIT
112         status &= ~ST0_FR;
113         status |= (current->thread.mflags & MF_32BIT_REGS) ? 0 : ST0_FR;
114 #endif
115         status |= KU_USER;
116         regs->cp0_status = status;
117         clear_used_math();
118         lose_fpu();
119         if (cpu_has_dsp)
120                 __init_dsp();
121         regs->cp0_epc = pc;
122         regs->regs[29] = sp;
123         current_thread_info()->addr_limit = USER_DS;
124 }
125
126 void exit_thread(void)
127 {
128 }
129
130 void flush_thread(void)
131 {
132 }
133
134 int copy_thread(int nr, unsigned long clone_flags, unsigned long usp,
135         unsigned long unused, struct task_struct *p, struct pt_regs *regs)
136 {
137         struct thread_info *ti = task_thread_info(p);
138         struct pt_regs *childregs;
139         long childksp;
140         p->set_child_tid = p->clear_child_tid = NULL;
141
142         childksp = (unsigned long)task_stack_page(p) + THREAD_SIZE - 32;
143
144         preempt_disable();
145
146         if (is_fpu_owner())
147                 save_fp(p);
148
149         if (cpu_has_dsp)
150                 save_dsp(p);
151
152         preempt_enable();
153
154         /* set up new TSS. */
155         childregs = (struct pt_regs *) childksp - 1;
156         *childregs = *regs;
157         childregs->regs[7] = 0; /* Clear error flag */
158
159 #if defined(CONFIG_BINFMT_IRIX)
160         if (current->personality != PER_LINUX) {
161                 /* Under IRIX things are a little different. */
162                 childregs->regs[3] = 1;
163                 regs->regs[3] = 0;
164         }
165 #endif
166         childregs->regs[2] = 0; /* Child gets zero as return value */
167         regs->regs[2] = p->pid;
168
169         if (childregs->cp0_status & ST0_CU0) {
170                 childregs->regs[28] = (unsigned long) ti;
171                 childregs->regs[29] = childksp;
172                 ti->addr_limit = KERNEL_DS;
173         } else {
174                 childregs->regs[29] = usp;
175                 ti->addr_limit = USER_DS;
176         }
177         p->thread.reg29 = (unsigned long) childregs;
178         p->thread.reg31 = (unsigned long) ret_from_fork;
179
180         /*
181          * New tasks lose permission to use the fpu. This accelerates context
182          * switching for most programs since they don't use the fpu.
183          */
184         p->thread.cp0_status = read_c0_status() & ~(ST0_CU2|ST0_CU1);
185         childregs->cp0_status &= ~(ST0_CU2|ST0_CU1);
186         clear_tsk_thread_flag(p, TIF_USEDFPU);
187
188         if (clone_flags & CLONE_SETTLS)
189                 ti->tp_value = regs->regs[7];
190
191         return 0;
192 }
193
194 /* Fill in the fpu structure for a core dump.. */
195 int dump_fpu(struct pt_regs *regs, elf_fpregset_t *r)
196 {
197         memcpy(r, &current->thread.fpu, sizeof(current->thread.fpu));
198
199         return 1;
200 }
201
202 void elf_dump_regs(elf_greg_t *gp, struct pt_regs *regs)
203 {
204         int i;
205
206         for (i = 0; i < EF_R0; i++)
207                 gp[i] = 0;
208         gp[EF_R0] = 0;
209         for (i = 1; i <= 31; i++)
210                 gp[EF_R0 + i] = regs->regs[i];
211         gp[EF_R26] = 0;
212         gp[EF_R27] = 0;
213         gp[EF_LO] = regs->lo;
214         gp[EF_HI] = regs->hi;
215         gp[EF_CP0_EPC] = regs->cp0_epc;
216         gp[EF_CP0_BADVADDR] = regs->cp0_badvaddr;
217         gp[EF_CP0_STATUS] = regs->cp0_status;
218         gp[EF_CP0_CAUSE] = regs->cp0_cause;
219 #ifdef EF_UNUSED0
220         gp[EF_UNUSED0] = 0;
221 #endif
222 }
223
224 int dump_task_regs (struct task_struct *tsk, elf_gregset_t *regs)
225 {
226         elf_dump_regs(*regs, task_pt_regs(tsk));
227         return 1;
228 }
229
230 int dump_task_fpu (struct task_struct *t, elf_fpregset_t *fpr)
231 {
232         memcpy(fpr, &t->thread.fpu, sizeof(current->thread.fpu));
233
234         return 1;
235 }
236
237 /*
238  * Create a kernel thread
239  */
240 ATTRIB_NORET void kernel_thread_helper(void *arg, int (*fn)(void *))
241 {
242         do_exit(fn(arg));
243 }
244
245 long kernel_thread(int (*fn)(void *), void *arg, unsigned long flags)
246 {
247         struct pt_regs regs;
248
249         memset(&regs, 0, sizeof(regs));
250
251         regs.regs[4] = (unsigned long) arg;
252         regs.regs[5] = (unsigned long) fn;
253         regs.cp0_epc = (unsigned long) kernel_thread_helper;
254         regs.cp0_status = read_c0_status();
255 #if defined(CONFIG_CPU_R3000) || defined(CONFIG_CPU_TX39XX)
256         regs.cp0_status &= ~(ST0_KUP | ST0_IEC);
257         regs.cp0_status |= ST0_IEP;
258 #else
259         regs.cp0_status |= ST0_EXL;
260 #endif
261
262         /* Ok, create the new process.. */
263         return do_fork(flags | CLONE_VM | CLONE_UNTRACED, 0, &regs, 0, NULL, NULL);
264 }
265
266 static struct mips_frame_info {
267         void *func;
268         unsigned long func_size;
269         int frame_size;
270         int pc_offset;
271 } *schedule_frame, mfinfo[64];
272 static int mfinfo_num;
273
274 static int __init get_frame_info(struct mips_frame_info *info)
275 {
276         int i;
277         void *func = info->func;
278         union mips_instruction *ip = (union mips_instruction *)func;
279         info->pc_offset = -1;
280         info->frame_size = 0;
281         for (i = 0; i < 128; i++, ip++) {
282                 /* if jal, jalr, jr, stop. */
283                 if (ip->j_format.opcode == jal_op ||
284                     (ip->r_format.opcode == spec_op &&
285                      (ip->r_format.func == jalr_op ||
286                       ip->r_format.func == jr_op)))
287                         break;
288
289                 if (info->func_size && i >= info->func_size / 4)
290                         break;
291                 if (
292 #ifdef CONFIG_32BIT
293                     ip->i_format.opcode == addiu_op &&
294 #endif
295 #ifdef CONFIG_64BIT
296                     ip->i_format.opcode == daddiu_op &&
297 #endif
298                     ip->i_format.rs == 29 &&
299                     ip->i_format.rt == 29) {
300                         /* addiu/daddiu sp,sp,-imm */
301                         if (info->frame_size)
302                                 continue;
303                         info->frame_size = - ip->i_format.simmediate;
304                 }
305
306                 if (
307 #ifdef CONFIG_32BIT
308                     ip->i_format.opcode == sw_op &&
309 #endif
310 #ifdef CONFIG_64BIT
311                     ip->i_format.opcode == sd_op &&
312 #endif
313                     ip->i_format.rs == 29 &&
314                     ip->i_format.rt == 31) {
315                         /* sw / sd $ra, offset($sp) */
316                         if (info->pc_offset != -1)
317                                 continue;
318                         info->pc_offset =
319                                 ip->i_format.simmediate / sizeof(long);
320                 }
321         }
322         if (info->pc_offset == -1 || info->frame_size == 0) {
323                 if (func == schedule)
324                         printk("Can't analyze prologue code at %p\n", func);
325                 info->pc_offset = -1;
326                 info->frame_size = 0;
327         }
328
329         return 0;
330 }
331
332 static int __init frame_info_init(void)
333 {
334         int i;
335 #ifdef CONFIG_KALLSYMS
336         char *modname;
337         char namebuf[KSYM_NAME_LEN + 1];
338         unsigned long start, size, ofs;
339         extern char __sched_text_start[], __sched_text_end[];
340         extern char __lock_text_start[], __lock_text_end[];
341
342         start = (unsigned long)__sched_text_start;
343         for (i = 0; i < ARRAY_SIZE(mfinfo); i++) {
344                 if (start == (unsigned long)schedule)
345                         schedule_frame = &mfinfo[i];
346                 if (!kallsyms_lookup(start, &size, &ofs, &modname, namebuf))
347                         break;
348                 mfinfo[i].func = (void *)(start + ofs);
349                 mfinfo[i].func_size = size;
350                 start += size - ofs;
351                 if (start >= (unsigned long)__lock_text_end)
352                         break;
353                 if (start == (unsigned long)__sched_text_end)
354                         start = (unsigned long)__lock_text_start;
355         }
356 #else
357         mfinfo[0].func = schedule;
358         schedule_frame = &mfinfo[0];
359 #endif
360         for (i = 0; i < ARRAY_SIZE(mfinfo) && mfinfo[i].func; i++)
361                 get_frame_info(&mfinfo[i]);
362
363         mfinfo_num = i;
364         return 0;
365 }
366
367 arch_initcall(frame_info_init);
368
369 /*
370  * Return saved PC of a blocked thread.
371  */
372 unsigned long thread_saved_pc(struct task_struct *tsk)
373 {
374         struct thread_struct *t = &tsk->thread;
375
376         /* New born processes are a special case */
377         if (t->reg31 == (unsigned long) ret_from_fork)
378                 return t->reg31;
379
380         if (!schedule_frame || schedule_frame->pc_offset < 0)
381                 return 0;
382         return ((unsigned long *)t->reg29)[schedule_frame->pc_offset];
383 }
384
385 /* get_wchan - a maintenance nightmare^W^Wpain in the ass ...  */
386 unsigned long get_wchan(struct task_struct *p)
387 {
388         unsigned long stack_page;
389         unsigned long pc;
390 #ifdef CONFIG_KALLSYMS
391         unsigned long frame;
392 #endif
393
394         if (!p || p == current || p->state == TASK_RUNNING)
395                 return 0;
396
397         stack_page = (unsigned long)task_stack_page(p);
398         if (!stack_page || !mfinfo_num)
399                 return 0;
400
401         pc = thread_saved_pc(p);
402 #ifdef CONFIG_KALLSYMS
403         if (!in_sched_functions(pc))
404                 return pc;
405
406         frame = p->thread.reg29 + schedule_frame->frame_size;
407         do {
408                 int i;
409
410                 if (frame < stack_page || frame > stack_page + THREAD_SIZE - 32)
411                         return 0;
412
413                 for (i = mfinfo_num - 1; i >= 0; i--) {
414                         if (pc >= (unsigned long) mfinfo[i].func)
415                                 break;
416                 }
417                 if (i < 0)
418                         break;
419
420                 pc = ((unsigned long *)frame)[mfinfo[i].pc_offset];
421                 if (!mfinfo[i].frame_size)
422                         break;
423                 frame += mfinfo[i].frame_size;
424         } while (in_sched_functions(pc));
425 #endif
426
427         return pc;
428 }
429