为什么我的Python程序的输出看起来很奇怪?

cgt*_*cgt 4 python multithreading output

我已经使用Python了一段时间,但在今天之前我从来没有真正做过任何并发.我偶然发现了这篇博文,并决定制作一个类似(但更简单)的例子:

import os
import threading
import Queue

class Worker(threading.Thread):
    def __init__(self, queue, num):
        threading.Thread.__init__(self)
        self.queue = queue
        self.num = num

    def run(self):
        while True:
            text = self.queue.get()
            #print "{} :: {}".format(self.num, text)
            print "%s :: %s" % (self.num, text)
            self.queue.task_done()

nonsense = ["BLUBTOR", "more nonsense", "cookies taste good", "what is?!"]
queue = Queue.Queue()

for i in xrange(4):
    # Give the worker the queue and also its "number"
    t = Worker(queue, i)
    t.setDaemon(True)
    t.start()

for gibberish in nonsense:
    queue.put(gibberish)

queue.join()
Run Code Online (Sandbox Code Playgroud)

它似乎工作正常,但似乎有一些我无法弄清楚的打印问题.几个测试运行:

chris@DPC3:~/code/pythonthreading$ python owntest.py 
0 :: BLUBTOR
 1 :: more nonsense
3 :: cookies taste good
 2 :: what is?!
chris@DPC3:~/code/pythonthreading$ python owntest.py 
0 :: BLUBTOR
2 :: more nonsense
3 :: cookies taste good0 :: what is?!

chris@DPC3:~/code/pythonthreading$ python owntest.py 
2 :: BLUBTOR
 3 :: more nonsense1 :: cookies taste good

 2 :: what is?!
chris@DPC3:~/code/pythonthreading$
Run Code Online (Sandbox Code Playgroud)

为什么输出格式奇怪?

Mar*_*ers 6

打印不是线程安全的.

当一些字符被stdout一个线程复制到流中时,另一个线程被调度也在打印,它可以将字符复制到stdout流中.

结果是你stdout不包含谨慎的print调用结果,而是来自不同线程的混合输出,所有这些都混杂在一起.

解决方法是使用sys.stdout.write(); 这一个原子(线程安全)操作.确保包含显式\n换行符.


NPE*_*NPE 6

print 不是原子的.

以下行:

        print "%s :: %s" % (self.num, text)
Run Code Online (Sandbox Code Playgroud)

被翻译成以下字节码:

         24 LOAD_CONST               1 ('%s :: %s')
         27 LOAD_FAST                0 (self)
         30 LOAD_ATTR                3 (num)
         33 LOAD_FAST                1 (text)
         36 BUILD_TUPLE              2
         39 BINARY_MODULO       
         40 PRINT_ITEM          
         41 PRINT_NEWLINE       
Run Code Online (Sandbox Code Playgroud)

如您所见,那里有两个打印字节码(PRINT_ITEMPRINT_NEWLINE).如果线程在两者之间被抢占,你会看到你所看到的.

我同意其他人sys.stdout.write()对此用例更安全的赌注,因为:

  1. 它强制你在编写之前格式化整个字符串(print你可能会意外地使用print a, b, c,并最终得到三个单独的写入而不是一个);
  2. 它回避了软件空间和自动换行的问题,这两个问题都可以与print程序其他部分的语句进行交互.